TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #868 · 18.09

Пришла настолка Ведьмак. Огромная коробка, весом, наверное, килограммов 20, еле дотащил. Кампания по предзаказу была аж 2.5 года назад и оказалась крупнейшей в России за всю историю предзаказов настольных игр. Причем, что характерно, большинство покупателей взяли бесстыдно дорогой топовый набор, включающий все дополнения, миниатюрки, плеймат и кучу всего ещё. Любят у нас всё-таки это польское фентези, как ни крути. Есть даже мнение, что именно из-за такого феноменального успеха настольного Ведьмака к нам на рынок вообще стали возить дорогие большие игры. Не обошлось без трудностей, конечно. В 2022 году поляки ожидаемо заартачились и, даже несмотря на то, что давно уже получили деньги, заявили, что русским они игру поставлять отказываются, а переводить её на язык орков это вообще недопустимая ересь. Компания Gaga, которая и занималась этим проектом в России, могла в одночасье потерять всё. Представьте: ещё вчера вы фирма, запустившая крупнейший в стране предзаказ, получившая десятки миллионов рублей, попавшая во все СМИ и находящаяся в центре внимания не только у заядлых настольщиков, но и у казуалов. А сегодня у вас нет денег, зато есть убитая в ноль репутация и куча хейта. Так могло бы быть, но каким-то невероятным чудом Гага уговорила поляков на выполнение обязательств. При условии, что в свободной продаже в рознице этой игры у русских не будет. Так что это не только долгожданный и едва не сорвавшийся релиз, но ещё и адский раритет теперь: на вторичном рынке сейчас цена такого набора доходит до 100к. Пока не ясно, когда смогу сыграть. Слишком много звёзд должны для этого сойтись. Но место на стеллаже, разумеется, давно уже ждало эти коробки :) #games

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #dataefficiency

当前筛选 #dataefficiency清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8234 · 08.08.2025 г., 10:01

🚀Прорыв от Google: активное обучение с экономией данных на 10 000× при дообучении LLM Google разработала масштабируемый процесс *active learning*, который позволяет в десятки тысяч раз сократить объём размеченных данных, необходимых для тонкой настройки больших языковых моделей на сложных задачах — например, при модерации рекламного контента. 🟢 Как работает метод: 1. Стартовая модель (LLM-0) получает промпт и автоматически размечает огромный массив данных. 2. Кластеризация выявляет примеры, где модель путается (наиболее спорные и ценные для обучения). 3. Отбор данных: из этих кластеров выбирают информативные и разнообразные примеры. 4. Экспертная разметка — только для выбранных примеров. 5. Итерации: дообучение модели → новый отбор спорных примеров → разметка → снова обучение. 🟢Результаты: - Сокращение с 100 000 размеченных примеров до менее 500 при сохранении или улучшении качества. - Улучшение метрики *Cohen’s Kappa* на 55–65 %. - В больших продакшн-моделях — до 3–4 порядков меньше данных при сопоставимом или лучшем качестве. 🟢Что такое Cohen’s Kappa? Это метрика, которая показывает, насколько два "судьи" (например, эксперт и модель) согласны между собой с поправкой на случайные совпадения. - 0.0 — нет согласия (или хуже случайного) - 0.41–0.60 — умеренное согласие - 0.61–0.80 — значительное - 0.81–1.00 — почти полное согласие В задачах с дисбалансом классов Kappa даёт более честную оценку, чем обычная точность (accuracy). Чем лучше предыдущих методов: - Точечная разметка: размечаются только самые информативные примеры. - Масштабируемость: метод применим к наборам данных с сотнями миллиардов примеров. - Экономия ресурсов: меньше времени и затрат на разметку. - Быстрая адаптация: подходит для доменов с быстро меняющимися правилами (реклама, модерация, безопасность). 🟢Вывод: При умном отборе данных LLM можно адаптировать в тысячи раз быстрее и дешевле, чем при традиционном обучении на больших размеченных наборах. #GoogleResearch#ActiveLearning#AI#LLM#MachineLearning#DataEfficiency 🟠Почитать подробно @ai_machinelearning_big_data #GoogleResearch#ActiveLearning#AI#LLM#MachineLearning#DataEfficiency