Намери подобно съдържание

Изходен канал @clockstackwheels · Post #766 · 22.02

Тёму Лебедева заблочили на ютубе с концами. До этого отключали на 2-3 недели, а сейчас удалили основной и резервный каналы. Он давно говорил о такой возможности, так что ни для него, ни для его аудитории особо никакой катастрофы не случилось (все ролики всё время дублировались в несколько соцсетей). Интересно тут другое. Я, как вы помните, уже около года регулярно его смотрю. И вся риторика там сводится к: "Я люблю жить в России". Никаких призывов к насилию, например, никогда не было: более того, он прямым текстом много раз подчёркивал, что против любого проявления насилия, что войну надо называть войной и так далее. Если детально разобрать любой его ролик за последний год, то там будет не более чем выражение личного мнения, пусть и с матом и местами грубо и прямолинейно. Я в значительной степени уверен, что Ютуб забанил Тёму не за содержание его видео, потому что тогда нужно перебанить всё, кроме каналов для младенцев. Думаю, что Ютуб забанил Тёму просто за количество страйков, которые на него регулярно уже много времени массово кидают идеологические противники. Ну, то есть, скорее всего достаточно большой толпой можно закрыть практически любой канал. Косвенно эту гипотезу подтверждает и тот факт, что в тот же день забанили канал блогера Камикадзе Д (помните такого?), который как раз вёл, наоборот, крайне антироссийскую риторику. Да, Ютуб принадлежит Гуглу, а про Гугл понятно, что он ангажирован. И, всё-таки, скорее всего просто не особо хотели разбираться, а с миллионом страйков делать что-то надо. Тёме конечно пофиг, у него бизнес не зависит от видеоблога. Но есть люди, которые прям сильно пострадали из-за таких блокировок (например Стас Ай как просто). Казалось бы — нужно не строить своё дело в такой значительной зависимости от какой-либо корпорации. Но капитализм и монополии зачастую не дают никакого выбора: попробуй, например, выпусти мобильное приложение без зависимости от Эпла или Гугла. #web

Hashtags

#web

Резултати

Намерени 1 подобни публикации

Търсене: #activelearning

当前筛选 #activelearning清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #8234 · 08.08.2025 г., 10:01

Намери подобни Прегледай

🚀Прорыв от Google: активное обучение с экономией данных на 10 000× при дообучении LLM Google разработала масштабируемый процесс *active learning*, который позволяет в десятки тысяч раз сократить объём размеченных данных, необходимых для тонкой настройки больших языковых моделей на сложных задачах — например, при модерации рекламного контента. 🟢 Как работает метод: 1. Стартовая модель (LLM-0) получает промпт и автоматически размечает огромный массив данных. 2. Кластеризация выявляет примеры, где модель путается (наиболее спорные и ценные для обучения). 3. Отбор данных: из этих кластеров выбирают информативные и разнообразные примеры. 4. Экспертная разметка — только для выбранных примеров. 5. Итерации: дообучение модели → новый отбор спорных примеров → разметка → снова обучение. 🟢Результаты: - Сокращение с 100 000 размеченных примеров до менее 500 при сохранении или улучшении качества. - Улучшение метрики *Cohen’s Kappa* на 55–65 %. - В больших продакшн-моделях — до 3–4 порядков меньше данных при сопоставимом или лучшем качестве. 🟢Что такое Cohen’s Kappa? Это метрика, которая показывает, насколько два "судьи" (например, эксперт и модель) согласны между собой с поправкой на случайные совпадения. - 0.0 — нет согласия (или хуже случайного) - 0.41–0.60 — умеренное согласие - 0.61–0.80 — значительное - 0.81–1.00 — почти полное согласие В задачах с дисбалансом классов Kappa даёт более честную оценку, чем обычная точность (accuracy). Чем лучше предыдущих методов: - Точечная разметка: размечаются только самые информативные примеры. - Масштабируемость: метод применим к наборам данных с сотнями миллиардов примеров. - Экономия ресурсов: меньше времени и затрат на разметку. - Быстрая адаптация: подходит для доменов с быстро меняющимися правилами (реклама, модерация, безопасность). 🟢Вывод: При умном отборе данных LLM можно адаптировать в тысячи раз быстрее и дешевле, чем при традиционном обучении на больших размеченных наборах. #GoogleResearch#ActiveLearning#AI#LLM#MachineLearning#DataEfficiency 🟠Почитать подробно @ai_machinelearning_big_data #GoogleResearch#ActiveLearning#AI#LLM#MachineLearning#DataEfficiency

Hashtags

#googleresearch #activelearning #ai #llm #machinelearning #dataefficiency