TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 6 подобни публикации

Търсене: #observability

当前筛选 #observability清除筛选
GitHub Trends

@githubtrending · Post #15326 · 11.12.2025 г., 11:30

#python#agents#gcp#gemini#genai_agents#generative_ai#llmops#mlops#observability You can quickly create and deploy AI agents using the Agent Starter Pack, a Python package with ready-made templates and full infrastructure on Google Cloud. It handles everything except your agent’s logic, including deployment, monitoring, security, and CI/CD pipelines. You can start a project in just one minute, customize agents for tasks like document search or real-time chat, and extend them as needed. This saves you time and effort by providing production-ready tools and integration with Google Cloud services, letting you focus on building smart AI agents without worrying about backend setup or deployment details. https://github.com/GoogleCloudPlatform/agent-starter-pack

GitHub Trends

@githubtrending · Post #14661 · 02.05.2025 г., 11:30

#typescript#ai#analytics#datasets#dspy#evaluation#gpt#llm#llmops#low_code#observability#openai#prompt_engineering LangWatch helps you monitor, test, and improve AI applications by tracking performance, comparing different setups, and optimizing prompts automatically. It works with any AI tool or framework, keeps your data secure, and lets you collaborate with experts to fix issues quickly, making your AI more reliable and efficient. https://github.com/langwatch/langwatch

GitHub Trends

@githubtrending · Post #14859 · 24.06.2025 г., 11:30

#typescript#cli#clustering#concurrency#dependency_injection#effect#error_handling#javascript#observability#opentelemetry#platform#schema#typescript#workflows Effect is a powerful TypeScript framework that helps you build reliable and complex applications by managing side effects like logging, network calls, and database operations in a safe and organized way. It uses a core `Effect` type to describe workflows that are lazy, composable, and type-safe, allowing you to handle errors and dependencies explicitly. The framework is modular, with many packages for AI, CLI tools, distributed computing, SQL databases, and more, making it flexible for various needs. Using Effect improves code quality, concurrency handling, and maintainability, helping you write robust TypeScript apps efficiently[1][2][4][5]. https://github.com/Effect-TS/effect

GitHub Trends

@githubtrending · Post #15066 · 16.08.2025 г., 12:30

#python#agents#ai#api_gateway#asyncio#authentication_middleware#devops#docker#fastapi#federation#gateway#generative_ai#jwt#kubernetes#llm_agents#mcp#model_context_protocol#observability#prompt_engineering#python#tools The MCP Gateway is a powerful tool that unifies different AI service protocols like REST and MCP into one easy-to-use endpoint. It helps you manage multiple AI tools and services securely with features like authentication, retries, rate-limiting, and real-time monitoring through an admin UI. You can run it locally or in scalable cloud environments using Docker or Kubernetes. It supports various communication methods (HTTP, WebSocket, SSE, stdio) and offers observability with OpenTelemetry for tracking AI tool usage and performance. This gateway simplifies connecting AI clients to diverse services, making development and management more efficient and secure. https://github.com/IBM/mcp-context-forge

GitHub Trends

@githubtrending · Post #15415 · 15.01.2026 г., 12:30

#go#bpf#cncf#cni#containers#ebpf#k8s#kernel#kubernetes#kubernetes_networking#loadbalancing#monitoring#networking#observability#security#troubleshooting#xdp Cilium is an eBPF-based tool for Kubernetes that delivers fast networking, deep visibility, and strong security. It creates simple Layer 3 networks across clusters, handles load balancing to replace kube-proxy, enforces identity-based policies from L3 to L7 (like HTTP or DNS rules), supports service mesh with encryption, and offers Hubble for real-time traffic monitoring. Stable versions like v1.18.6 run on AMD64/AArch64. You gain scalable performance, easier policy management without IP hassles, better troubleshooting, and higher efficiency for large cloud-native apps, cutting costs and boosting reliability. https://github.com/cilium/cilium

GitHub Trends

@githubtrending · Post #15021 · 01.08.2025 г., 13:30

#go#argocd#cloud_native#cncf#container_management#devops#ebpf#hacktoberfest#istio#jenkins#k8s#kubernetes#kubernetes_platform_solution#kubesphere#llm#multi_cluster#observability#servicemesh KubeSphere is an easy-to-use, open-source platform that helps you manage Kubernetes clusters across clouds, data centers, and edge devices from one place. It offers a friendly web interface, supports multi-cluster and multi-tenant management, and automates DevOps tasks like CI/CD pipelines. You get built-in monitoring, logging, alerting, and security features such as role-based access control. It also includes an App Store for quick deployment of applications and supports various storage and networking options. This makes managing complex Kubernetes environments simpler, faster, and more secure, saving you time and reducing operational challenges. https://github.com/kubesphere/kubesphere