TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #osmo

当前筛选 #osmo清除筛选

🐬DOLPHIN | AI PREDICTIONS 13.01.2024 00:00 GMT Expected 5% Profit/Loss in 24 Hours #OSMO | 1.7437 | PP: 82% | LP: 97% #SEI | 0.6791 | PP: 70% | LP: 99% #STX | 1.634 | PP: 68% | LP: 98% #SKL | 0.08865 | PP: 63% | LP: 91% #OM | 0.06588 | PP: 57% | LP: 98% #WNXM | 53.81 | PP: 26% | LP: 92% #CHR | 0.2573 | PP: 25% | LP: 99% #ICP | 12.232 | PP: 20% | LP: 93% #NEXO | 0.893 | PP: 18% | LP: 94% #BNB | 296.6 | PP: 5% | LP: 92% ——————————————————————— Total Predictions: 367 PP > 50%: 12 LP > 50%: 51 PP > 60%: 11 LP > 60%: 38 PP > 70%: 8 LP > 70%: 26 PP > 80%: 3 LP > 80%: 13 PP > 90%: 0 LP > 90%: 10 ——————————————————————— PP: Profit Probability | LP: Loss Probability

🐬DOLPHIN | AI PREDICTIONS 17.03.2024 00:00 GMT Expected 5% Profit/Loss in 24 Hours #TROY | 0.002931 | PP: 99% | LP: 14% #XLM | 0.1292 | PP: 99% | LP: 14% #ZEC | 29.08 | PP: 99% | LP: 14% #QNT | 123.4 | PP: 99% | LP: 15% #PENDLE | 2.5185 | PP: 99% | LP: 16% #SNT | 0.04476 | PP: 99% | LP: 16% #SNX | 3.996 | PP: 99% | LP: 16% #VIB | 0.08893 | PP: 99% | LP: 16% #WING | 9.6 | PP: 99% | LP: 16% #YFI | 8877 | PP: 99% | LP: 16% #POWR | 0.3938 | PP: 99% | LP: 17% #PYR | 7.716 | PP: 99% | LP: 17% #SCRT | 0.6228 | PP: 99% | LP: 17% #SXP | 0.4379 | PP: 99% | LP: 17% #TIA | 13.75 | PP: 99% | LP: 17% #TWT | 1.3507 | PP: 99% | LP: 17% #UMA | 4.015 | PP: 99% | LP: 17% #PROS | 0.5068 | PP: 99% | LP: 18% #PUNDIX | 0.6027 | PP: 99% | LP: 18% #WAXP | 0.07902 | PP: 99% | LP: 18% #VET | 0.04046 | PP: 99% | LP: 20% #VTHO | 0.003851 | PP: 99% | LP: 20% #RDNT | 0.3406 | PP: 99% | LP: 23% #SC | 0.009372 | PP: 99% | LP: 24% #WOO | 0.4561 | PP: 99% | LP: 24% #WRX | 0.2741 | PP: 99% | LP: 26% #USTC | 0.02857411 | PP: 99% | LP: 30% #T | 0.03411 | PP: 99% | LP: 31% #UNFI | 7.656 | PP: 98% | LP: 13% #VGX | 0.1251 | PP: 98% | LP: 13% #SFP | 0.708 | PP: 98% | LP: 14% #ONG | 0.3793 | PP: 98% | LP: 16% #PORTO | 2.738 | PP: 98% | LP: 16% #RPL | 29 | PP: 98% | LP: 16% #SKL | 0.08973 | PP: 98% | LP: 17% #WAN | 0.2703 | PP: 98% | LP: 17% #PEOPLE | 0.04006 | PP: 98% | LP: 18% #XTZ | 1.291 | PP: 98% | LP: 18% #OSMO | 1.3818 | PP: 98% | LP: 19% #ONT | 0.3293 | PP: 98% | LP: 20% #PERP | 1.53711 | PP: 98% | LP: 20% #POLYX | 0.2222 | PP: 98% | LP: 20% #QKC | 0.013515 | PP: 98% | LP: 20% #RAD | 2.355 | PP: 98% | LP: 20% #REQ | 0.1284 | PP: 98% | LP: 20% #SAND | 0.6274 | PP: 98% | LP: 20% #TRU | 0.07445 | PP: 98% | LP: 20% #UTK | 0.1067 | PP: 98% | LP: 20% #VOXEL | 0.3238 | PP: 98% | LP: 20% #XRP | 0.6031 | PP: 98% | LP: 20% ... ——————————————————————— Total Predictions: 371 PP > 50%: 370 LP > 50%: 54 PP > 60%: 370 LP > 60%: 31 PP > 70%: 364 LP > 70%: 16 PP > 80%: 257 LP > 80%: 3 PP > 90%: 138 LP > 90%: 0 ——————————————————————— PP: Profit Probability | LP: Loss Probability