TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 66 подобни публикации

Търсене: #human

当前筛选 #human清除筛选

人類研究幾千年來 大部份人也是基因混血 國家/國籍 = 與基因血緣沒有關係 基因= 大部份人的基因也沒有100%純正 歷代祖先 = 很多今天的國家,在古代也不存在, 所以不要亂說自己祖先是那國及那種人。 膚色 = 人種頂多能分 : 黑人 白人 黄人 及中亞人 , 再細分也是一樣, 某國那國也只是國籍政治及文化圈劃分( 基因也是不純的) #Human

Hashtags

Everything Science

@everything_science · Post #3445 · 10.05.2025 г., 08:15

man from New Zealand named Nigel Richards won the French Scrabble championship without actually speaking French. #Human 🔔@Everything_Science

Hashtags

Everything Science

@everything_science · Post #3441 · 07.05.2025 г., 17:01

Former billionaire Chuck Feeney has given away over 99% of his $8 billion to help underprivileged kids go to college. By the time of his passing in October 2023, he was worth less than $2 million. #Human 🔔@Everything_Science

Hashtags

Everything Science

@everything_science · Post #3433 · 04.05.2025 г., 06:38

This woman donated a kidney to her boss and then got fired for taking extended time to recover from the surgery. #Human 🔔@Everything_Science

Hashtags

Everything Science

@everything_science · Post #3430 · 02.05.2025 г., 10:00

When Messi heard a boy had been wearing his jersey made from a plastic bag, he sent the boy a real one signed by him. #Human 🔔@Everything_Science

Hashtags

Everything Science

@everything_science · Post #3406 · 20.04.2025 г., 20:16

In 1978, Richard Branson wanted to impress his girlfriend by pretending to buy a private island. The island was listed for $6 million and he offered $100,000 as a joke. The owner settled for $180,000 and Branson bought Necker Island. #Human 🔔@Everything_Science

Hashtags

123•••56
ПредишнаСтр. 1 от 6Следваща