TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #621 · 31.10

У меня в друзьях есть классный автор — Владимир Бычко. Владимир — проект-менеджер, ведёт реально интересный standalone-блог об управлении проектами и не только. Например, последний пост с правилами жизни — не какая-то унылая несовместимая с реальностью псевдофилософия "а ля Дуров", а действительно полезные и правильные наблюдения. Владимир один из самых интересных авторов среди моих ВК-подписок, однако, читаю я его посты крайне редко, и здесь проявляются серьёзные недостатки standalone, о чём я сейчас расскажу. Вообще, сервис-ориентированный интернет если не умирает, то, как минимум, теряет своих сторонников. Многие айтишники, интеллектуалы, авторы текстов уже высказываются о необходимости слезать с иглы корпораций, эти самые корпорации дешевеют, люди в сети активно выстраивают модели децентрализованного "веб три ноль". Дополнением к этому идёт акцент на медиа против текстов: сервисы уже не особо скрывают, что текстовая часть для них второстепенна, а внимание брошено туда, где хайп и толпы — например, в вертикальные видео и короткоживущий контент. В России этот эффект особенно заметен, именно поэтому вместо какой-нибудь устойчивой текстовой площадки большинство взрослых вменяемых авторов пишут в Telegram. Который для этого подходит чуть лучше, чем плоскогубцы для отвинчивания гаек — можно, конечно, и все мы так делали за неимением альтернатив. На этой волне неоднократно слышал призывы "уходи в standalone". Сделай свой сайт с RSS-фидом, любым оформлением, пиши туда. Как автор блога, я и правда мог бы такое сделать и даже видеть немало плюсов. Но, как читатель, я до сих пор не подписан ни на один standalone-блог, даже если мне очень нравится контент. Проанализировал основные четыре проблемы стэндэлонов. 1. Люди всё равно приходят из соцсетей, но ссылки в соцсетях оформлены некрасиво, понижаются в охватах и требуют дополнительное действие со стороны человека. Последнее особенно важно: конверсия в прочтение критически низкая даже для встроенных редакторов лонгридов и даже при условии, что пользователю сообщение со ссылкой покажется (например Telegram > Telegraph). 2. RSS это не замена ленте сообщений. Нет удобного централизованного способа читать RSS в формате той площадки, которая тебе близка. Сам Владимир, например, ссылается на RSS-бота для Телеграма, который требует для своей работы быть подписанным на какой-то канал. Ну ладно, есть нормальные RSS-боты везде, но это всё опять же выглядит как лента с внешними ссылками, а не как лента сообщений в формате площадки. 3. У каждого стэндэлона свой дизайн. Если я впервые на странице нового для себя автора ВК или в Telegram, я тут всё знаю. Мне привычно и удобно. Я знаком с навигацией, я привык к шрифтам, я знаю, где лайки и комментарии. К каждому новому стэндэлону нужно привыкать и тратить когнитивные ресурсы на обучение. 4. Обсуждений нет, если нет комьюнити. Да, какой-нибудь Вастрик смог создать вокруг своего стэндэлон-блога комьюнити, за которое люди даже платят. Но это единичные примеры. Обсуждения в ЖЖ работали, потому что был социальный граф: люди знали топовых авторов и более менее знали друг друга. Обсуждения в соцсетях работают по той же причине, пока в них есть аудитория: часть людей связана социальным графом, другая часть может в этот граф заходить со стороны и чувствовать себя комфортно, кроме случаев токсичной атмосферы. Но если мы проанализируем, как ведут себя обсуждения там, где социального графа нет (например, на YouTube), то увидим просто всплески очень ограниченных локальных диалогов под каким-то особо популярным комментарием и всё. Комьюнити там нет за редкими исключениями. Интернету пока ещё точно рано standalone. Только авторы, уже собравшие огромную аудиторию через соцсети, могут себе такое позволить. И то, с оговорками. #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #maitrix

当前筛选 #maitrix清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #7957 · 04.07.2025 г., 13:03

🌟WM-ABench: тестирование VL-моделей на понимание физики реального мира. Мaitrix Org разработали WM-ABench, бенчмарк для оценки VLM в качестве так называемых «моделей мира». Идея проста: проверить, насколько хорошо топовые модели способны не просто распознавать картинки, а понимать окружающую действительность и предсказывать ее изменения. Создатели, опираясь на когнитивную науку, создали фреймворк, который тестирует 15 самых популярных моделей по 23 параметрам, разделяя процесс на 2 ключевых этапа: восприятие и прогнозирование. В основе бенчмарка - огромный датасет из более чем 100 тысяч примеров, сгенерированных в 6 различных симуляторах, от ThreeDWorld и Physion до Carla. Чтобы модели не искали легких путей и не полагались на поверхностные совпадения, в тест добавили «сложные негативы» - контрфактические состояния, которые заставляют систему действительно анализировать происходящее. Весь процесс был разделен на оценку восприятия (распознавание объектов, пространства, времени, движения) и прогнозирования (симуляция физики, транзитивный и композиционный вывод). Для калибровки сложности задач были установлены базовые показатели, основанные на результатах людей. 🟡Результаты. С простым визуальным восприятием, то есть с определение цвета или формы, все модели справляются отлично. Однако когда дело доходит до трехмерного пространственного мышления, динамики движения или временных последовательностей, начинаются серьезные проблемы. Выяснилась и другая любопытная деталь: VLM склонны «спутывать» физические понятия. Например, если в сцене изменить только цвет объекта, модель может внезапно ошибиться в оценке его размера или скорости. Оказалось, что цвет и форма являются самыми влиятельными атрибутами, которые искажают восприятие других, не связанных с ними характеристик. 🟡Но главная проблема кроется глубже. Точное восприятие мира совершенно не гарантирует точного прогноза. Исследование показало, что даже при идеально верном распознавании текущего состояния сцены модели проваливают предсказание физических взаимодействий. Разрыв с человеческими способностями явный: в задачах на транзитивный вывод он достигает 46%, а композиционный вывод выполняется на уровне случайного угадывания. 🟡Бенчмарк подсветил фундаментальный недостаток: У современных VLM отсутствуют базовые знания физики, необходимые для симуляции даже простейших событий. Они видят мир, но не понимают, по каким законам он живет. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Arxiv 🟡Датасет @ai_machinelearning_big_data #AI#ML#VLM#Benchmark#Maitrix