TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 16 подобни публикации

Търсене: #databases

当前筛选 #databases清除筛选
Repositorio data science

@repo_science · Post #3374 · 30.06.2023 г., 14:57

#python#databases 🐍 Advanced Python: Working with multiple databases Description Build and connect Python Application to multiple databases 🔗Link ----- Main channel: @repo_science Coupons: @freecoupons_reposcience -----

Repositorio data science

@repo_science · Post #3265 · 04.06.2023 г., 22:32

#python#databases 🐍 Advanced Python: Practical Database Examples Level up as a Python developer working with databases in this advanced, skills-based course. 🔗Link ----- Main channel:@repo_science Coupons: @freecoupons_reposcience -----

Repositorio data science

@repo_science · Post #4219 · 20.10.2024 г., 21:14

#free#Databases 🎟 2024 Complete SQL Bootcamp from Zero to Hero in SQL 👥Students: 43024 ⭐️Ratings: 4.12 ⏳ 4.5 total hours 🌐 en_US 🗒 Limited coupons (639) 🎫 100% OFF - 💵0💲 ----- Coupons:@freecoupons_reposcience ----- ⭐️ This message was automated by 🔗n8n

Repositorio data science

@repo_science · Post #3381 · 03.07.2023 г., 00:51

#databases#SQL SQLBolt ¿Quieres aprender SQL de forma práctica y desde cero? SQLBolt es un recurso para devs con: ◆ Ejercicios interactivos y sencillos ◆ Ejemplos desde cero ◆ De SELECT a crear tus propias tablas ◆ 18 lecciones para aprender Es un recurso 100% gratuito. 🔗Link ----- Main channel: @repo_science Coupons: @freecoupons_reposcience -----

Repositorio data science

@repo_science · Post #3322 · 19.06.2023 г., 22:42

#databases#sql 🛠 SQL Server 2022 Administration Description Looking to get up to speed with the latest features of SQL Server 2022? In this course, join database analyst and trainer Eric Johnson as he covers the fundamental skills, techniques, and tools required to manage SQL Server 2022 in any development environment, regardless of your current level of experience. Learn about the new features available in the latest version of SQL Server as well as how to provision and secure Azure databases, design SQL Server tables, and tune and optimize SQL to meet your own unique needs. Throughout the course, Eric explains the relevant concepts and methodologies of managing and automating SQL Server databases, showing you how to apply what you’ve learned in a series of ongoing visual demonstrations designed to help you get hands-on practice and start building more advanced skills. 🔗Link ----- Main channel:@repo_science Coupons:@freecoupons_reposcience -----

Repositorio data science

@repo_science · Post #3402 · 07.07.2023 г., 00:57

#databases#MongoDB 💼 Learning MongoDB Get started with MongoDB. Learn how to use this popular nonrelational database to power your full-stack development workflow. ⏳2h 44m 🗣Justin Jenkins 🔗Link ----- Main channel:@repo_science Coupons: @freecoupons_reposcience -----

Repositorio data science

@repo_science · Post #3423 · 11.07.2023 г., 14:22

#Python#databases#sql 🐍 Data Science Fundamentals with Python and SQL Description Data science is one of the hottest professions of the decade, and the demand for data scientists who can analyze data and communicate results to inform data driven decisions has never been greater. This Specialization from IBM will help anyone interested in pursuing a career in data science by teaching them fundamental skills to get started in this in-demand field. 🗣Coursera 🔗Link ----- Main channel:@repo_science Coupons:@freecoupons_reposcience -----

Repositorio data science

@repo_science · Post #3204 · 19.05.2023 г., 03:28

#databases#GraphQL 💾 Building Web APIs with GraphQL - The Complete Guide Become an expert in one of the most exciting web APIs framework with this practical, hands-on course 🔗Link ----- Main channel: @repo_science Coupons: @freecoupons_reposcience -----

GitHub Trends

@githubtrending · Post #14933 · 09.07.2025 г., 12:30

#go#databases#genai#llms#mcp The MCP Toolbox for Databases helps developers connect AI agents to databases more easily and securely. It simplifies the process by handling complex tasks like connection pooling and authentication, allowing you to integrate databases with AI agents using minimal code. This toolbox supports the Model Context Protocol (MCP), which standardizes how AI interacts with external tools. By using MCP Toolbox, you can automate database tasks, query databases using natural language, and generate context-aware code, all of which save time and improve development efficiency. https://github.com/googleapis/genai-toolbox

12
ПредишнаСтр. 1 от 2Следваща