TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #af

当前筛选 #af清除筛选
RIIIV - Airdrops

@riiivdrop · Post #1737 · 03.12.2025 г., 08:02

🔥 Aithereum Network 🏷 Earn $AFD For All User ➡️ Airdrop LINK- https://aithereumnetwork.com?ref=IM39YC • Connect Google Account • Do Task > Daily check in • Done #af

Hashtags

中文名:邦男人(ARGONAVIS from BanG Dream! 梦想协奏曲) 话数: 13 放送开始: 2020年4月10日 放送星期: 星期五 导演: 錦織博 脚本: 毛利亘宏、後藤みどり 分镜: 松園公、植高正典、杉島邦久、今義和、錦織博、榎田美咲、三村厚史、梅津朋美、なかの陽、高橋直希、増田敏彦 ☺️评分:5.9 还行 💙故事简介 北海道、函館。 ヨーロッパと日本文化が融合した、 華やかな建物が並ぶ街―― この街で僕たちは出会い、ぶつかりあい、 そして輝く大ステージへと運命の船を漕ぎ出していく。 やがてこの歌が運命だったと気づく。 🔐解压:blackcatunderthemoon 引索:#A#AF 标签:#游戏改#原创#偶像 🗣请不要在讨论中打开链接,请使用频道消息的链接或者表格,讨论中的链接是失效的,百度网盘是自提取,如果没有自提取复制链接可以看到提取码,禁止在线解压

Libertà è ragione

@libertaeragione · Post #3857 · 11.06.2023 г., 20:45

#Montenegro Proiezione dei seggi di CDT per partito: #PES|Centro anti-corruzione: 24 seggi #DPS-#LP|S&D|RE: 21 #DNP-#NSD-#RP|Populisti filoserbi|Minoranza serba|Radicali: 14 #DCG-#URA|EPP|G/EFA: 12 #BS|EPP: 6 #PD-#Forca|Minoranza albanese: 1 #AF (#AA-#DIK)|Minoranza albanese: 1 #HGI|Minoranza croata: 1 @OsservatorioEsteri