Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

#dev

Резултати

Намерени 3 подобни публикации

Търсене: #stack

当前筛选 #stack清除筛选

科技&趣闻&杂记

@kejiqu · Post #3429 · 15.05.2025 г., 02:06

Намери подобни Прегледай

随着流量下降 Stack Overflow 考虑品牌重塑 Stack Overflow 流量持续下滑，母公司 Stack Exchange 考虑品牌重塑。官方数据显示，2025 年 4 月的问题和答案数量同比下降超过 64%，较 2020 年 4 月的峰值下降超过 90%。 CEO Prashanth Chandrasekar 透露，公司正在探索在问答功能之外增加社区和职业发展服务。 Stack Exchange 已经在测试多项新服务，包括 AI Answer Assistant、Question Assistant，以及与 Indeed 合作的招聘网站。Solidot 🏷#Stack#Overflow#AI#流量下降 📢频道👥群组📝投稿

Hashtags

#stack #overflow #ai #流量下降

TestFlight Games

@TFGames · Post #1301 · 05.12.2023 г., 13:30

Намери подобни Прегледай

#COLOR#HOOP#STACK#GAME https://testflight.apple.com/join/G9eX9Dc2

Hashtags

#color #hoop #stack #game

科技&趣闻&杂记

@kejiqu · Post #4221 · 02.03.2026 г., 12:50

Намери подобни Прегледай

Stack Overflow 添加新功能（包括 AI Assist），重新思考“外观和感觉” Stack Overflow 宣布推出重新设计的 beta 版本，并新增多项功能，包括 AI Assist、开放式问题支持以及 Coding Challenges 等。据 DevClass.com 报道，Stack Overflow 2014 年初每月接收的问题数量超过 200,000 个，但 2025 年 12 月仅为 3,862 个，同比下降 78%。此次更新旨在改善用户体验，构建一个以人为本、AI 赋能的技术交流平台。新站点将于 4 月正式上线，用户可访问 beta.stackoverflow.com 提供反馈。Slashdot 🏷#Stack#Overflow#AI#Assist#RAG 📢频道👥群组📝投稿

Hashtags

#stack #overflow #ai #assist #rag