TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 21 подобни публикации

Търсене: #cd

当前筛选 #cd清除筛选
🦅 [ perspective ix ]

@perspectiveix · Post #1119 · 20.02.2018 г., 19:00

​​💿 The Rise and Fall of the Compact Disc Having been hit by the rise of MP3 players in the early 2000s, #CD sales nearly halved between 2000 and 2007, which is when smartphones and the first music streaming services emerged to put the final nail in the compact disc’s little round coffin. #Nostalgia 🚀@PerspectiveIX 🌀 ⁣http://prs.pctvix.co/TelegramIX

中文名: 超电磁侠波鲁吉斯V(超电磁机器人 雷霆五号) 话数: 40 放送开始: 1977年6月4日 放送星期: 星期六 脚本: 鈴木良武、桜井正明、辻真先、田口勝彦 分镜: 高橋資祐、神田武幸、樋口雅一、長浜忠夫、富野由悠季、やまざきかずお、寺田和男 ☺️评分:7.2 推荐 💙故事简介 角の有無が階級を運命付けるボアザン星。ラ・ゴールは皇帝の甥(弟の長子)として皇位継承の資格を持ちながら、角が生まれつきなかった為失脚。妻・ロザリアとも引き裂かれて労奴に落とされるが、反乱を起こし、星から脱出。地球に落ち延びて科学者・剛光代に救われる。 ラ・ゴールは光代と結婚して剛健太郎と名乗り、3児を儲け、浜口博士や岡・防衛長官と共にボルテスや基地ビッグファルコンの建設に着手。 一方、ボアザンでラ・ゴールとロザリアとの間に生まれていた皇子ハイネルは、“裏切り者の子”と後ろ指を指され、皇帝ズ・ザンバジルへの忠誠を証明し実の父を倒すべく地球攻撃を決定した。 かくてボルテスとボアザンの獣士との壮絶な死闘が始まる。 💔OneDrive:打开表格 😱百度网盘:点击下载 😄往期番剧汇总表格:打开 🔐解压:blackcatunderthemoon 引索:#C#CD 标签:#原创#萝卜#科幻 🗣请不要在讨论中打开链接,请使用频道消息的链接或者表格,讨论中的链接是失效的,百度网盘是自提取,如果没有自提取复制链接可以看到提取码,禁止在线解压

#伪娘#cd#足交#足控#丝足#啪啪 超色女声骚脚伪娘收费群合集,超色伪娘,主打足控内容,足交还带淫语的,不是特别说明是伪娘,还真是分不出。还有跟粉丝约炮口交被大鸡鸡狂干,太涩了,喜欢伪娘的不容错过 入群联系🦶 @EchoWu521

12
ПредишнаСтр. 1 от 2Следваща