Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

#dev

Резултати

Намерени 3 подобни публикации

Търсене: #runtime

当前筛选 #runtime清除筛选

@golang · Post #58 · 22.04.2018 г., 20:22

Намери подобни Прегледай

Why are goroutines not lightweight threads? Kartik Khare shows us his meaning about goroutines, lightweight threads and their difference in GoLang. There are no code examples inside but good thoughts about parallelism, threads and useful links at the end of the article :) #development#runtime#language https://codeburst.io/why-goroutines-are-not-lightweight-threads-7c460c1f155f

Hashtags

#development #runtime #language

@golang · Post #64 · 21.06.2018 г., 16:17

Намери подобни Прегледай

Hi there! Which ways do you use to avoid memory leaks for REST API? In the following article by Iman Tumorang describes an excellent example of memory leaks, his solution, and results. Must have to read for everyone 😉 #development#runtime#architecture https://hackernoon.com/avoiding-memory-leak-in-golang-api-1843ef45fca8

Hashtags

#development #runtime #architecture

GitHub Trends

@githubtrending · Post #15382 · 01.01.2026 г., 12:30

Намери подобни Прегледай

#jupyter_notebook#agent#agentic_ai#agents#authentication#bedrock#core#gateway#identity_management#memory_management#production_code#runtime Amazon Bedrock AgentCore lets you build, deploy, and run AI agents securely at scale with any framework like CrewAI or LangGraph and any model, without managing complex infrastructure. It offers serverless runtime for long tasks up to 8 hours, gateway to connect tools like Slack or APIs easily, memory for personalized experiences, identity management, built-in code interpreter and browser tools, plus observability. This saves time by skipping heavy setup, speeds prototypes to production, cuts costs with pay-per-use, and boosts security—helping you create powerful agents faster for real business needs. https://github.com/awslabs/amazon-bedrock-agentcore-samples

Hashtags

#jupyter_notebook #agent #agentic_ai #agents #authentication #bedrock #core #gateway #identity_management #memory_management #production_code #runtime