TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #embeddings

当前筛选 #embeddings清除筛选
Data Science Jobs

@datasciencejobs · Post #3075 · 17.12.2025 г., 15:00

#вакансия#mlops#engineer#llm#vllm#hugginface#rag#embeddings#k8s#docker#deckhouse#Langfuse#LlamaIndex#remote Вакансия: MLOps-инженер Компания: АО СимбирСофт Формат работы: удалёнка Занятость: полная занятость Ищем MLOps инженера в РФ 👨‍💻 🚀 Нам нужен инженер, готовый развивать инфраструктуру LLM-платформы. Твоими задачами станут поддержка и развитие сервисов для больших языковых моделей, интеграция инструментов, настройка мониторингов и обеспечение безопасности данных. 🔍 Опыт работы с: - Большими языковыми моделями (vLLM, TGI, Hugging Face) - Python (FastAPI, скрипты, CLI) - Архитектурой RAG и embedding-моделями - Prometheus/Grafana - Система аутентификации (Keycloak, JWT) - Kubernetes, Docker, CI/CD 💡 Будут полезны знания: - Deckhouse или других дистрибутивов Kubernetes - Langfuse, LlamaIndex, PostgreSQL Vector, Chroma - Принципов MLOps и интеграции сторонних API ✅Условия: - Удаленный формат работы. - Гибкое начало рабочего дня. - Широкий технологический стек, сотни проектов. Можно разрабатывать IT-решения для разных отраслей, пробовать новые технологии. - Помогаем прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком. - Имеем развитую систему наставничества, проходим сертификацию за счет компании, участвуем в конференциях. Активно обмениваемся опытом, проводим внутренние и внешние митапы, прокачиваем hard и soft skills. Присоединяйся к нам!✨ Если заинтересовала вакансия, буду рада обсудить в тг: https://t.me/gulnara_s28 ʕ ᵔᴥᵔ ʔ

GitHub Trends

@githubtrending · Post #15556 · 12.03.2026 г., 12:30

#typescript#ai#ai_agents#coding#deno#embeddings#insforge#nextjs#oauth2#pgvector#postgresql#realtime#vectors#websockets InsForge is an open-source backend platform for AI coding agents, offering easy auth, Postgres database, S3 storage, edge functions, and model gateway via a simple semantic layer. Agents fetch context, configure services, and inspect state to build full-stack apps quickly. Set up locally with Docker or use cloud deploys. It boosts agent accuracy 1.7x, speed 1.6x, and cuts tokens 30% vs. rivals, letting you prototype and ship AI-driven apps faster with less hassle and cost. https://github.com/InsForge/InsForge

GitHub Trends

@githubtrending · Post #14800 · 07.06.2025 г., 11:30

#java#anthropic#chatgpt#chroma#embeddings#gemini#gpt#huggingface#java#langchain#llama#milvus#ollama#onnx#openai#openai_api#pgvector#pinecone#vector_database#weaviate LangChain4j helps you add powerful AI to your Java applications by making it easy to use Large Language Models (LLMs). It provides a simple way to switch between different LLMs and embedding stores without needing to learn each one's specific API. This means you can easily experiment with different models and tools, making your development process faster and more flexible. LangChain4j also offers many examples and tools to help you build complex AI applications quickly, such as chatbots and retrieval systems. This simplifies the integration of AI into your projects, allowing you to focus on creating better applications. https://github.com/langchain4j/langchain4j

GitHub Trends

@githubtrending · Post #15253 · 30.10.2025 г., 12:30

#go#agent#agentic#ai#chatbot#chatbots#embeddings#evaluation#generative_ai#golang#knowledge_base#llm#multi_tenant#multimodel#ollama#openai#question_answering#rag#reranking#semantic_search#vector_search WeKnora is a powerful tool that helps you understand and find answers in complex documents like PDFs and Word files. It uses advanced AI to read documents, understand what they mean, and answer your questions in a simple way. This tool is useful for businesses and researchers because it can quickly find information from many documents, making it easier to manage knowledge and make decisions. It also supports multiple languages and can be used privately, ensuring your data stays safe. https://github.com/Tencent/WeKnora