TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #239 · 3.03

Сервисы вопросники вроде TheQuestion и Яндекс.Кью не слишком честно обращаются с экспертами. Вот ты регистрируешься как, например, программист. Тебе там сразу рассказывают о том, как много людей ждёт именно твоих ответов на их вопросы. «Наконец-то я смогу поделиться своими знаниями с миром!» — думаешь ты. На деле большинство вопросов (по крайней мере по программированию) делятся на два вида: 1. Какая-то абсолютно невежественная дичь, типа «Как взломать QR код с помощью логарифмов?» 2. Вопрос связанный с очень узкой конкретной задачей на конкретных данных спрашивающего. Всё бы хорошо, но чаще всего вопрос сформулирован очень плохо, потому что это чьё-то домашнее задание или студенческая работа. Нередко спрашивающий хочет сойти за умного и просто нагромождает термины без нужного контекста, типа «Как обрезать дерево решений?» (и всё, больше никаких подробностей в вопросе). В итоге настоящего «Поделиться знаниями» так и не происходит. Я вот получил ещё в прошлом году статус эксперта на Кью, и забил. Вопросы очень скучные. #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #rrncb

当前筛选 #rrncb清除筛选

🚀 20 августа 2025 Стартует RRNCB – Russian RAG Normative – Corporate Benchmark, первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной, правовой и технической документацией компаний. Почему это важно? ✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно. ✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией. ✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами. ✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе. Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов). Участие. 📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие. В вашем распоряжении будут: • Независимый лидерборд. • Управление сабмитами. • Возможность тестировать сабмиты до отправки в лидерборд. • Разделение сабмитов на категории cloud и on-prem. 🗓Даты проведения: Запуск: 20 августа Регистрация RAG решений участников: до 3го сентября Результаты: 20 сентября. Почему стоит участвовать. • Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта. Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие. • Попадание в топ лидерборда — это готовый повод для PR. • Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах. • Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды. • Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки. Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/ Инициатор проведения бенчмарка - ООО Аватар Машина. #RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource