TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #bbp

当前筛选 #bbp清除筛选

Год назад одно казахстанское интернет-издание выпустило материал с конкретным заголовком: "Строительство АЭС в Казахстане: как вывести из игры "Росатом"? Подобных материалов про американских, французских и прочих подрядчиков до сих пор нет. Что уже наводит на подозрения разного рода. Например, кому-то очень нужно, чтобы АЭС не строил "Росатом". Но кому? Чтобы ответить на этот вопрос, вспомним недавнее прошлое. В 2017 году японская компания Toshiba купила одного из главных конкурентов "Росатома" - обанкротившуюся американскую компанию Westinghouse Electric. Японской компанией WE была недолго: в апреле 2018 года ее выкупил холдинг из Канады Brookfield Business Partners (BBP). Теперь конкурентом российских атомщиков является "дочка" BBP — компания Brookfield Infrastructure (BI). Другой главный конкурент "Росатома" - французская компания Orano (бывшая Areva). В том же 2018 году произошла еще одна любопытная сделка. Подробности на сайте cronos.asia #АЭС #Росатом #BBP #Казахстан

Ultimora.net - POLITICS

@ultimoraPOLITICS · Post #39317 · 12.05.2022 г., 18:40

#Sondaggi#Turchia Sondaggio di ORC: #AKP|Destra: 28% #CHP|S&D: 24% #İYİ|Centro-destra: 18% (+1) #HDP|S&D: 9% (+0,5) #MHP|Estrema destra: 7% (-1) #GP|Centro-destra: 2% #DEVA|Centro: 2% #SP|Estrema destra islamica: 2% #TDP|Centro-sinistra kemalista: 2% (+0,5) #YRP|Estrema destra islamica: 1% #BTP|Centro kemalista alevista: 1% #MP|Centro-sinistra kemalista: 1% #BBP|Estrema destra islamica: 1% (+0,5) #DP|Centro-destra: 1% Data rilevazione: 5-8 maggio +/-: 17-22 aprile Intervistati: 5300 @UltimoraPolitics

Ultimora.net - POLITICS

@Ultimorapolitics · Post #37788 · 28.04.2022 г., 13:53

#Sondaggi#Turchia Sondaggio di ORC: #AKP|Destra: 28% #CHP|S&D: 24% (+1) #İYİ|Centro-destra: 17% #HDP|S&D: 8,5% (-0,5) #MHP|Estrema destra: 8% #GP|Centro-destra: 2% (-1) #DEVA|Centro: 2% (-1) #SP|Estrema destra islamica: 2% (+0,5) #TDP|Centro-sinistra kemalista: 1,5% (+0,5) #YRP|Estrema destra islamica: 1% #BTP|Centro kemalista alevista: 1% #MP|Centro-sinistra kemalista: 1% #ZAFER|Destra kemalista: 1% (+1) #DP|Centro-destra: 1% #HÜDAPAR|Estrema destra curda islamica: 0,5% (-0,5) #BBP|Estrema destra islamica: 0,5% (+0,5) Data rilevazione: 17-22 aprile +/-: 31 marzo-3 aprile Intervistati: 4385 @UltimoraPolitics