TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 6 подобни публикации

Търсене: #evaluation

当前筛选 #evaluation清除筛选

🌍Innovatsion biznesda texnologik transfer mavzusida amaliy seminar 🎓 Respublikamizda tadbirkorlik subyektlari tomonidan innovatsion ishlanmalar, yangi texnologiyalar va nou-xaularni ishlab chiqarishga joriy etishni qo‘llab-quvvatlash maqsadida Biznes va tadbirkorlik oliy maktabi 2024-yil 5-6-noyabr kunlari “Innovatsion biznes va startaplarni rivojlantirishda texnologiyalar transferi” mavzusida ikki kunlik seminar tashkil etmoqda. ➡️ Seminardan maqsad innovatsion loyihalarni amalga oshirishda ilm-fan yutuqlari va innovatsion ishlanmalarga oid texnologik transferni keng qo‘llashning amaliy jihatlarini o‘rganishdan iborat. 💠 Tadbirda Koreyalikekspert va mahalliymutaxassislar tomonidan mavzuga oid taqdimot, ma’ruza hamda muhokamalar o‘tkaziladi. 🔹 Seminarda ishtirok etish uchun 2024-yil 4-noyabrga qadar ro‘yxatdan o‘tish lozim. 🔗Ro‘yxatdan o‘tish. 🔷 Ishtirokchilar soni cheklangan. 🔝 Sanasi: 5-6-noyabr 🔝 Vaqti: 09-30 – 13-00 📞 Telefon: +99871 239-03-27 🇬🇧Eng 🇷🇺Ru #GraduateSchool#Healthtech#Startup#Evaluation 🔝Web-site |🔝Facebook | 🔝Instagram | 🔝Youtube

🌟Startup Evaluation: HealthTech Series 🌟 📣Biznes va tadbirkorlik oliy maktabi Toshkent tibbiyot akademiyasi bilan hamkorlikda sog‘liqni saqlash va tibbiy texnologiyalar sohasida dastlabki inkubatsiya bosqichidagi startap loyihalarni qo‘llab-quvvatlash va rivojlantirish bo‘yicha “Startup Evaluation: HealthTech Series” loyihasini amalga oshirmoqda. 💠Tadbirdan maqsad - sog‘liqni saqlash sohasida yosh startap tashabbuskorlari hamda biznes va ta’lim sohasidagi yetakchi ekspertlar o'rtasida samarali muloqotni tashkil etishdan iboratdir. Tadbir yosh startap egalari uchun startap loyihasini rivojlantirishda qulay imkoniyat yaratadi. ➡️Tadbirda startaplarni quyidagilar kutmoqda: 🔘 o‘z biznes loyihalarini taqdimot qilish va ekspertlar bilan startaplarni amalgaoshirish bo‘yicha fikr almashish imkoniyati; 🔘 bizines sohasidagi yetakchi professor va ekspertlardan maslahatlar olish; 🟣 startap loyihalarnitakomillashtirish bo‘yicha navbatdagi qadamlarni muhokama qilish; 🟡 startaplarni kelgusida rivojlantirish bo‘yicha Oliy maktabining ko‘magiga tayanish. 🔍Ma’lumot uchun: “Startup Evaluation" loyihasi - bu Biznes va tadbirkorlik oliy maktabining startaplarni qo‘llab-quvvatlash platformasi bo‘lib, yosh startap tashabbuskorlarining startap loyihalarini qisqa muddatda amalga oshirish bo‘yicha o’zaro hamkorlikni nazarda tutadi. 🗓 Sana: 2024-yil 8-oktabr 🕖 Vaqt: 09:00-13:00. 📱 Telefon: +998712390327 📍 Joylashuv: Biznes va tadbirkorlik oliy maktabi (5-qavat) 🇬🇧Eng 🇷🇺Ru #GraduateSchool#Healthtech#Startup#Evaluation 🔝Web-site |🔝Facebook | 🔝Instagram | 🔝Youtube

GitHub Trends

@githubtrending · Post #14797 · 06.06.2025 г., 12:00

#python#agents#document_search#evaluation#guardrails#llms#optimization#prompts#rag#vector_stores Ragbits is a tool that helps build and deploy GenAI applications quickly. It offers features like swapping between many language models, ensuring safe interactions with these models, and connecting to various data storage systems. Ragbits also includes tools for managing data and testing prompts, making it easier to develop reliable AI applications. This helps users create more accurate and efficient AI systems by integrating the latest data and reducing errors. Overall, Ragbits makes it faster and more efficient to develop and deploy AI applications. https://github.com/deepsense-ai/ragbits

GitHub Trends

@githubtrending · Post #14661 · 02.05.2025 г., 11:30

#typescript#ai#analytics#datasets#dspy#evaluation#gpt#llm#llmops#low_code#observability#openai#prompt_engineering LangWatch helps you monitor, test, and improve AI applications by tracking performance, comparing different setups, and optimizing prompts automatically. It works with any AI tool or framework, keeps your data secure, and lets you collaborate with experts to fix issues quickly, making your AI more reliable and efficient. https://github.com/langwatch/langwatch

GitHub Trends

@githubtrending · Post #15253 · 30.10.2025 г., 12:30

#go#agent#agentic#ai#chatbot#chatbots#embeddings#evaluation#generative_ai#golang#knowledge_base#llm#multi_tenant#multimodel#ollama#openai#question_answering#rag#reranking#semantic_search#vector_search WeKnora is a powerful tool that helps you understand and find answers in complex documents like PDFs and Word files. It uses advanced AI to read documents, understand what they mean, and answer your questions in a simple way. This tool is useful for businesses and researchers because it can quickly find information from many documents, making it easier to manage knowledge and make decisions. It also supports multiple languages and can be used privately, ensuring your data stays safe. https://github.com/Tencent/WeKnora

GitHub Trends

@githubtrending · Post #14768 · 31.05.2025 г., 12:00

#typescript#ci#ci_cd#cicd#evaluation#evaluation_framework#llm#llm_eval#llm_evaluation#llm_evaluation_framework#llmops#pentesting#prompt_engineering#prompt_testing#prompts#rag#red_teaming#testing#vulnerability_scanners Promptfoo is a tool that helps developers test and improve AI applications using Large Language Models (LLMs). It allows you to **test prompts and models** automatically, **secure your apps** by finding vulnerabilities, and **compare different models** side-by-side. You can use it on your computer or integrate it into your development workflow. This tool helps you make sure your AI apps work well and are secure before you release them. It saves time and ensures quality by using data instead of guessing. https://github.com/promptfoo/promptfoo