TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 8 подобни публикации

Търсене: #void

当前筛选 #void清除筛选
雨声

@ameisbest · Post #3407 · 03.04.2026 г., 15:35

Dedication #Doujin#A198#Void#Diverse_System 🗺 Album: AD:PIANO Ⅲ 🗺 Release Date: 2014-12-30 🗺 Composer: Void 推这首是因为DS社团刚刚公布了AD:PIANO X的一般公募的合格名单,然后顺便点名表扬了某位"とんでもねえ奴"。 推特原文大意: 我(主催YsK439)觉得这应该是 Diverse 长达 20 年左右的公募历史上头一遭:当时我发去了邀请,大概是因为对方腾不出时间或者太忙了,一直没回音。我当时还想:“唉,看来是太忙了,真可惜。”结果万万没想到,有个胆大包天的家伙,居然在公募截稿前的最后一刻直接杀进来了。 没错,说的就是你 (这里@了Void)。 我当时真是惊呆了,心想这到底是什么情况?后来核实了一下,原来是他后来又有空了,但觉得已经过了回复期限不好意思再联系,干脆就直接走公募渠道投了稿。这剧情也太棒了吧!我当时就想“行,那我一定好好评审”,结果这家伙确实实力强悍,轻轻松松就过关了。 最后的结果就是:他亲手夺回了那个本就为他预留的席位。 这并没有占用公募的合格名额,无论有没有这件事,名额本来就在增加。 个人来说,这操作太帅了。而且这种有点笨拙的感觉正好是我很喜欢的类型,说实话真的挺开心的。谢谢你。 *AD:PINAO是选拔制度,Void是直邀并预留席位。 *时隔多年的ADPX作为DS社团最激烈的战斗,真的可以期待一下。 📕VGMdb