TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 35 подобни публикации

Търсене: #rip

当前筛选 #rip清除筛选
Политдиректор

@politdirector_msk · Post #22954 · 22.08.2023 г., 21:00

“Lasciatemi cantare con la chitarra in mano lasciatemi cantare una canzone piano piano lasciatemi cantare perché ne sono fiero sono un italiano un italiano vero…” Ciao, un Vero Italiano… #RIP

Hashtags

https://ya.ru/video/preview/8887215744709927524 25 июля - день памяти великого русского поэта и барда Владимира Семеновича Высоцкого. В память о нем публикуем шуточную песню про Африку. #RIP

Hashtags

#转发#RIP https://www.ithome.com/0/595/941.htm // 2022年1月4日,对Blackberry 10、Blackberry 7.1 OS的剩余基础设施支持服务将会停止。 // 永远怀念右上角的黑莓标志... (从右向左数第二个) // 从右向左数第四个是漫游(Roaming)标志,这个标志很贵(x)。

Hashtags

ФИЛИПОВ•КАНСК

@filipov_kansk · Post #394 · 06.04.2022 г., 10:31

Сегодня [06.04.22] на 75-м году, ушёл из жизни Владимир Вольфович Жириновский. Яркий и харизматичный политик. Пусть земля ему будет пухом… #жириновский#rip

#News#RIP 🕯美国著名导演大卫·林奇去世,享年78岁 当地时间1月16日,经其家人证实,美国著名超现实主义导演大卫·林奇(David Lynch)去世,终年78岁。他的家人在其Facebook页面上发布了他去世的消息,“我们全家人,非常悲痛地宣布,艺术家大卫林奇已经辞世。我们也希望暂时能保有隐私。现在他已经不在我们身边,世界从此变得空洞了,但是,也正如他所说的:‘把目光集中在甜甜圈上,而不是甜甜圈中间的洞上。’今天是晴空万里的好日子,金色的阳光,从湛蓝的天空洒下。” 大卫·林奇曾指导、制作出多部经典好莱坞电影和剧集,代表作品有《穆赫兰道》《蓝丝绒》和《双峰》等。 Channel:@Odyssey+

Hashtags

#News#RIP 🕯演员郑佩佩去世,曾出演《大醉侠》《唐伯虎点秋香》 据导演胡雪桦消息,演员郑佩佩离世,享年78岁。郑佩佩曾主演中国新派武侠电影开山之作《大醉侠》,被誉为“武侠影后” Channel:@Odyssey+

Hashtags

ПредишнаСтр. 1 от 3Следваща