@cat_airport_channel · Post #1651 · 22.05.2022 г., 09:33
#Logs 新加坡,马来西亚,澳大利亚,印度正在调试优化速率,期间可能掉线/波动,我们会很快完成维护。
Hashtags
TGINSIGHT SIMILAR POSTS
Изходен канал @clockstackwheels · Post #851 · 2.08
Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev
Hashtags
Търсене: #logs
@cat_airport_channel · Post #1651 · 22.05.2022 г., 09:33
#Logs 新加坡,马来西亚,澳大利亚,印度正在调试优化速率,期间可能掉线/波动,我们会很快完成维护。
Hashtags
@cat_airport_channel · Post #1228 · 23.03.2022 г., 03:45
#Logs 长沙联通坏掉了 待会换新机器 影响等级:C+
Hashtags
@cat_airport_channel · Post #1224 · 22.03.2022 г., 23:58
#Logs 部分中转的供应商上游将在3-5日后拔线,届时会有大量节点信息变更 请各位做好更新订阅的准备~ 影响等级:A-
Hashtags
@cat_airport_channel · Post #1221 · 22.03.2022 г., 11:10
#Logs 日本RG节点配置被误删 正在抢修 影响等级:C 已恢复
Hashtags
@cat_airport_channel · Post #1208 · 21.03.2022 г., 01:39
#Logs 韩国Oracle恢复
Hashtags
@cat_airport_channel · Post #1205 · 20.03.2022 г., 12:15
#Logs 华为云CC维护 影响等级:C+
Hashtags
@cat_airport_channel · Post #1201 · 20.03.2022 г., 07:23
#Logs 正在进行大规模维护...... 影响等级:B
Hashtags
@cat_airport_channel · Post #1189 · 19.03.2022 г., 13:03
#Logs 深港IPLC的香港端坏掉啦,不知道是被哪个坏蛋搞的 影响等级:C+
Hashtags
@cat_airport_channel · Post #1186 · 19.03.2022 г., 12:43
#Logs 华为云CC和佛港专线忘记续了,马上好 影响等级:C+
Hashtags
@cat_airport_channel · Post #1185 · 19.03.2022 г., 12:32
#Logs 香港Kirino机房出现严重网络波动 疑似正在被扫段攻击 影响等级:C
Hashtags
@testflightynoti · Post #38231 · 14.05.2026 г., 08:45
#Crash#Buddy#Debug#crash#logs Join the Crash Buddy - Debug crash logs beta on ✈️#TestFlight 🔗 Link: https://testflight.apple.com/join/tp96uCpD Shared by Dimitri