TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #358 · 26.05

Интересная настольная игра для вечеринок "Опасные Слова". В этой игре классически нужно объяснять слово своей команде, по аналогии с тем, как это делается в "Шляпе" ("Alias"). Но есть важное дополнение. Допустим, вам попалось слово "меч". Команда противника тоже знает, что у вас за слово. И она составляет список слов-ловушек, пытаясь угадать, какие слова вы можете захотеть сказать при объяснении слова меч. Вам эти слова нельзя будет произносить, иначе объяснение не засчитывается. Вы этот список сами не видите, просто знаете, что он есть. Таким образом, вы не можете заведомо исключить конкретные слова из вашего объяснения, но должны по возможности стараться не говорить всё, что вообще относится к "мечу". И вот здесь основная фишка этой игры. Как объяснить "колесо", не говоря ничего про круглое, транспорт, езду, шины итд? Через несколько раундов оказывается, что "колесо" это что-то из топологии, "носорог" это толстый аналог сказочной лошади, а "жираф" это нечто, что упоминается при описании возвратного гортанного нерва. Заставляет очень много и нестандартно думать. Формально до 8 игроков, но по факту можно играть хоть большой толпой. Категорически рекомендую. Если не найдёте, где купить (сейчас что-то с поставками туго), то можете просто скачать правила: для игры на самом деле нужен случайный источник слов и листочки с карандашами. #games

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #llmarena

当前筛选 #llmarena清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8560 · 16.09.2025 г., 16:22

🔥 Как реально выбирают LLM в 2025 — исследование LLM Arena Интересный опрос практиков (инженеров, ML-учёных, AI-продуктов) - как сегодня на самом деле выбирают языковые модели (LLM), что важнее: бенчмарки или собственные тесты, цена/скорость/качество, и чего не хватает в информации по моделям. 📊Ключевые выводы - 82,2% респондентов проводят собственные тесты; бенчмарки — лишь ориентир, не решение. - 26,7% вообще не пользуются бенчмарками. - В центре внимания: баланс качество / цена / скорость, устойчивость (без галлюцинаций), соответствие инфраструктуре. 👥 Участники опроса - 45 практиков с опытом работы с LLM-продуктами; все участники — профессионалы. - ML/AI Инженеры, Data Scientists, AI-строители, и менеджмент. 🔑 Что ищут и какие сигналы важны: - Часто оценивают обсуждаемость модели в статьях/сообществе; практическое применение в похожих продуктах. - Обращают внимание на число скачиваний и звёзд на Hugging Face / GitHub. - Хотят больше данных о требованиях к железу, лицензиях, локальной работе, графиках “цена vs качество”, “скорость vs качество”. ⚠️Проблемы & доверие - Многие не доверяют существующим бенчмаркам из-за методологических проблем (train/test leakage, нерелевантность задач). - Лабораторные условия часто сильно отличаются от продакшн. - Нехватка отзывов по реальным сценариям и использованиям. При выборе LLM важнее собственные тесты и контекст задач, чем рейтинги. Специалисты хотят поточечных данных: про лицензии, требования к железу, latency, стоимость. Инициатор исследования Роман Куцев - фаундер и CEO LLM Arena, публикуют много интересного у себя в блоге. Для тех, кто строит LLM-продукты, полезно: - Не ориентироваться только на чужие бенчмарки. - Собирать метрики в собственных условиях — на реальных данных. - Открыто показывать, что работает, а что — нет, в документации и обсуждениях. 🟢 Полное исследование: https://research.llmarena.ru/ #LLM#AI#ИИ#LLMArena#исследование#нейросети#benchmarks