TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 55 подобни публикации

Търсене: #pt

当前筛选 #pt清除筛选
SIN LÍNEA MX (OFICIAL)

@SINLINEAMXnoticias · Post #31084 · 26.03.2026 г., 14:47

🚨 ¡IMPORTANTE! 🚨 🔴 Esta fue la reserva que presentó el #PT para echar abajo el tema de la revocación de mandato en la elección del 2027 ❌🗳️👇🏻

Hashtags

xz の 小站

@xjzim · Post #6281 · 06.12.2021 г., 09:41

Torrentleech PT站开放注册 - http://www.torrentleech.org/ - 注册码 XMAS2021 - 无考核 简介: 0day类型资源站,站点运营时间十多年,资源也达到了几十万的数量,会员达到了十多万。 —————— PS:今天看到有人发,就顺带分享下,顺便说下国外PT站的一些的情况。 一般国外PT站不同于国内PT站,大部分基本都无硬性考核要求。比如注册一个月内下XX GB 上传 XX GB,分享率到达 XX 这种。国外一般都是注册后默认给一定上传量即 upload quota,之后你可以挑选你喜欢的种子下载,做种率必须高于一定比例 即 ratio,否则账户会失去下载权力甚至被ban。 此站我印象中17年初就注册了,此站注册不给任何上传量,即你的 upload; download, ratio 三项默认均为0。当你开始下种后便开始算入download,并影响你的ratio。且此站硬性保种需要10天以上,否则算H&R。建议新手直接选择大于14GB的默认 free 资源先把数据刷上去。 —————— 综合来说不建议 PT 新手盲目冲。此站作为国外PT站,资源上还行,算是靠前的,但是缺乏国内本土资源。且盒子用户较多,上传数据较为难刷。上传刷不上去的,可以折中选择保种赚取points换上传量。「可以理解为国内PT站的魔力值系统」 —————— 如果使用服务器下种/做种;注册后要登记seedbox信息 点自己的账号,然后seedboxes标签,填上ip,provider和网速保存;再点profile,在has seedbox变成yes即可 #pt

Hashtags

iShare News

@iShareNews · Post #713 · 06.08.2021 г., 14:29

#PT 高清阿童木站—开注3天 8月8是1周年生日。 高清阿童木站 计划在8月7日~8月9日,开放注册三天。 注册地址:https://hdatmos.club ● 频道 @iShareNews

Hashtags

iShare News

@iShareNews · Post #691 · 28.06.2021 г., 01:26

#PT HDarea高清视界开放注册 👉注册地址 https://www.hdarea.co/ 6.27开始,为期一周。 ● 频道 @iShareNews

Hashtags

iShare News

@iShareNews · Post #681 · 31.05.2021 г., 10:37

#PT BTSchool开放注册 六一(2021.06.01)当天,网站开注6小时(10:00~~16:00) 👉注册地址 ● 频道 @iShareNews

Hashtags

iShare News

@iShareNews · Post #675 · 28.05.2021 г., 05:21

#PT 铃音开放注册 本站将于即日起全站free并开放注册到6月1日,喜欢学习的不要错过。 👉注册链接 ● 频道 @iShareNews

Hashtags

iShare News

@iShareNews · Post #660 · 05.05.2021 г., 14:40

#PT skyeysnow/天雪动漫PT站开放注册 资源特色就是动漫了,喜欢动漫的不要错过。 👉注册地址 ● 频道 @iShareNews

Hashtags

ПредишнаСтр. 1 от 5Следваща