TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 97 подобни публикации

Търсене: #sp

当前筛选 #sp清除筛选
IB美术馆

@PaintingCollections2 · Post #3875 · 20.04.2026 г., 16:26

[SP]SP 2023.11.30—2025.7.2 画师:#SP 预览未展示全面,全部差分原图和整合压缩包请进入评论区或点击下方超链跳转查看 压缩包 SP老师的往期传送门(之后可能会有一期拆分成两期展示,我会标注出来也请注意查看捏) 2023.11.30—2025.7.2 2021.4.30—2023.11.30 —————————— 本频道分享的资源切勿进行买卖商用,如有条件还请在画师的赞助支持渠道获取赞助奖励 SP老师主页:PixivTwitterPatreonFanbox —————————— 资源有任何问题请加入下方聊天反馈群进行反馈,爱你们 图集主频道(临时复活版):@PaintingCollections2 聊天反馈撩骚群:@ChaoJiShiBu 游戏区分馆:@MoNvZhiJia23333 防失联及各附属频道导航:@IBgallery233 求物帖:传送门

Hashtags

IB美术馆

@PaintingCollections2 · Post #3867 · 19.04.2026 г., 16:12

[SP]SP 2021.4.30—2023.11.30 画师:#SP 预览未展示全面,全部差分原图和整合压缩包请进入评论区或点击下方超链跳转查看 压缩包 SP老师的往期传送门(之后可能会有一期拆分成两期展示,我会标注出来也请注意查看捏) 2021.4.30—2023.11.30 —————————— 本频道分享的资源切勿进行买卖商用,如有条件还请在画师的赞助支持渠道获取赞助奖励 SP老师主页:PixivTwitterPatreonFanbox —————————— 资源有任何问题请加入下方聊天反馈群进行反馈,爱你们 图集主频道(临时复活版):@PaintingCollections2 聊天反馈撩骚群:@ChaoJiShiBu 游戏区分馆:@MoNvZhiJia23333 防失联及各附属频道导航:@IBgallery233 求物帖:传送门

Hashtags

No.150 #sp 祝福的话不必多说, 感谢大家一路相伴; 回望初心,未曾更易, 继看未来,道阻且长。 遥望三千里,明月照两旁, 但为人安康,我心不彷徨。 新的一年,与君共行 源链接/保存原图

Hashtags

No.110 #sp 2021,感谢大家的一路陪伴,小众的频道,有了你们,就成了广阔的天地;俱往矣,期未来! 2022,新的一年,新的开始,没有过多的辞藻,只希望大家每一天都能开开心心;这一年,我们继续启航! 源链接/保存原图

Hashtags

123•••89
ПредишнаСтр. 1 от 9Следваща