TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 5 подобни публикации

Търсене: #thread

当前筛选 #thread清除筛选
ALL About RSS

@AboutRss · Post #1220 · 16.06.2022 г., 01:00

聚合阅读平台 Matter Reader 宣告支持 RSS 官方 #Thread :https://twitter.com/getmatterapp/status/1537117989627080704 内含一个如何添加 RSS url 的指导视频。其作为阅读平台的理念是:若用户填入的 RSS Feed 是高频更新的话,其会提示信息过量导致阅读压力增加的风险,但仍交由用户选择。 官网: https://hq.getmatter.com/

Hashtags

``🖤 T H R E A D my fancasts on characters of the novel qqgk подбор фанкаста исключительно мое мнение, и оно может не совпадать с вашим🩷 тред представлен в комментариях:) просьба ничего не писать, пока тред не будет выложен полностью. #thread | #qqgk

Hashtags

ALL About RSS

@AboutRss · Post #1177 · 28.02.2022 г., 01:00

Typefully Profiles 让你用 Twitter Thread 写博客 #Typefully 是 Mailbrew 家的 #Twitter Thread 撰写工具,最近的更新发布了一个让用户利用 #Thread 写博客的功能,并为生成的 Post 配置了 RSS Feed。虽然感叹分久必合、合久必分,堪称 blog 到 microblog 再到 blog 的一个循环,但确实一举两得了,使之成为内容发布者的一个利器。 https://typefully.com/profile 经试用,一些 Tips : 🔸发布第一条 Post 即可激活你的 Profile : https://typefully.com/{你的 Twitter 名} 🔸过去的 Thread 也可以发布成 Post 🔸RSS Feed 是全文输出 🔸免费 🔸支持 #PWA 我的 Profile : https://typefully.com/aboutRSS 发现于 https://twitter.com/typefullyapp/status/1496434716873936897

djangoproject

@djangoproject · Post #298 · 17.04.2017 г., 07:42

#AI#Artificial_Intelligence #aiohttp #API #AWS #asyncio #audio #automated_testing #automation #atexit #BeeWare #button #client #concurrency #cron #Coroutine #data_analysis #data_mining #data_processing #database #Deep_Learning #Debian #decorator #dispatch #django #dropdownbox #Docker #event #Firefox #form #freeze #functool #Generator #GeoDjango #Google #GPU #Gym #learn #Image_processing #intelligence #input #IOT #lambda #lists #machine_learning #Magenta #map #Metaprogramming #Micro_services #mind #monitoring #MongoDB #Mozilla #Multipart #multi_touch_apps #multiprocessing #Nodes #NoSQL #numeric_computation #numerical #NumPy #OAuth #object_serialization #OCR #overloading #package #parallel #pipeline #protocols #PostGIS #pyAudioAnalysis #PyInstaller #PySide #PyTorch #pytest #python #Pyvideo_archives #Qt #Redis #random #request #REST #satellite #scrapy #scikit_learn #SciPy #searching #submit #selectbox #Selenium #serialization #server #session #socket #sound #task #TensorFlow #text_boxes #text #test #telegram #Thread #transport #tuples #Universe #Unix #urllib #upload #Web