TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #notify

当前筛选 #notify清除筛选
BotsGram®

@botsgram_cu · Post #3217 · 30.11.2020 г., 21:31

@GitHubBot Qué puede hacer este bot? Este es un bot de GitHub. Puede notificarle sobre eventos en sus repositorios públicos de GitHub. También puede responder a tus mensajes para publicar comentarios en GitHub directamente desde Telegram. Idioma: Inglés (visto en @BotsGram_cu) #telegram, #notify, #events, #github, #delete, #public, #command, #messages, #repository

BotsGram®

@botsgram_cu · Post #3318 · 22.12.2020 г., 23:47

@RRemindersBot Qué puede hacer este bot? Con este bot puedes establecer recordatorios para eventos importantes Idioma: Inglés (visto en @BotsGram_cu) #alert, #alert, #remind, #notification, #reminder, #memory, #memorize, #remember, #notify, #timer, #timing, #timed, #forget, #keep, #productivity, #productivity

折腾实验室频道

@TossLabChannel · Post #87 · 06.11.2024 г., 07:57

#青龙#签到 #青龙面板签到合集 仓库收集了一些签到任务,大家愉快的玩耍吧! #千图网签到 #天翼云盘签到 #帆软签到 #阿里云盘签到 #顺丰速运 #IKuuu机场签到帐号版 #科技玩家签到 #富贵论坛签到 #达美乐.py #逑美在线 #星空代理签到 #春茧未来荟 #999会员中心 #天气推送 #恩山签到 #微博.py #小米社区任务得成长值 #STLXZ签到 #百度贴吧 #爱奇艺.py #喜马拉雅签到 #值得买每日转盘签到 #雨云签到 #夸克签到 #福彩活动 #3freenom多帐户续期 #notify.py #爱茅台 #蜜堂签到 #腾讯视频签到 #ddnsto七天续费 #freenom多帐户续期 #500w #丽宝乐园小程序签到 #小米运动 #什么值得买签到 #喜马拉雅转盘抽奖 #一点万象签到 拉库命令: 国外VPS: ql repo https://github.com/tossiphone/only_for_happly.git "" "backup" "" "" 国内VPS: ql repo https://ghproxy.com/https://github.com/tossiphone/only_for_happly.git "" "backup" "" "" 📱仓库地址:点击链接 📢折腾青龙群组 @TossQL 🎈折腾青龙频道 @TossQLChannel