TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #845 · 21.07

Итак, сторисы в Телеграме. Вы меня знаете, как убеждённого хейтера всех новых форматов: начиная от сторис, заканчивая короткими вертикальными видео. Я могу часами рассуждать о том, как "общество деградирует". Но популярность этой наркоты так непредставимо огромна, что даже псевдо-идеалист Дуров не сдержался, и: — Своровал напрямую фичу из другого сервиса, хотя не любит так делать, — Вставил в продуманный мессенджер для интеллектуалов ширпотребный продукт. Фундаментальная проблема Телеграм-сторис в том, что люди, которые у меня в контактах в мессенджере, и люди, от которых интересно смотреть регулярный медиа-контент — это два очень слабо пересекающихся множества. Я утром обнаружил в списке сторис кучу непонятных ноунеймов, и почти всегда оказывалось, что это какой-нибудь менеджер какого-нибудь заказчика, с которым мы обменивались рабочей документацией три года назад. Это не мой друг, не блогер, не член семьи, так что смотреть сторисы от него/неё для меня не имеет никакого смысла. Пожалуй, сторисы нужны были бы только в каналах, но... их там не сделали вообще. Иногда мышление команды Телеграма выходит за пределы моего понимания. Вместе с тем, совершенно никак не исправлены привычные болячки и косяки этого формата, хотя Дуров вроде как в превью обещал, что Телеграм-сторисы будут какими-то особенными, и реализованы не так, как у всех. Но что мы видим? Те же самые неизбежно вертикальные фото/видео. Нет инструментов, чтобы запостить горизонтальный контент, которого до сих пор в сети очень много (например, кадр из фильма, кусочек стрима видеоигры итд). Та же проблема с текстами: чтобы читать сторисы, нужно держать палец на экране. В общем, совершенно те же говносторисы, что и везде. В целом, плюс у этого только один: надеюсь, данная функция добьёт в России инсту. #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #maitrix

当前筛选 #maitrix清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #7957 · 04.07.2025 г., 13:03

🌟WM-ABench: тестирование VL-моделей на понимание физики реального мира. Мaitrix Org разработали WM-ABench, бенчмарк для оценки VLM в качестве так называемых «моделей мира». Идея проста: проверить, насколько хорошо топовые модели способны не просто распознавать картинки, а понимать окружающую действительность и предсказывать ее изменения. Создатели, опираясь на когнитивную науку, создали фреймворк, который тестирует 15 самых популярных моделей по 23 параметрам, разделяя процесс на 2 ключевых этапа: восприятие и прогнозирование. В основе бенчмарка - огромный датасет из более чем 100 тысяч примеров, сгенерированных в 6 различных симуляторах, от ThreeDWorld и Physion до Carla. Чтобы модели не искали легких путей и не полагались на поверхностные совпадения, в тест добавили «сложные негативы» - контрфактические состояния, которые заставляют систему действительно анализировать происходящее. Весь процесс был разделен на оценку восприятия (распознавание объектов, пространства, времени, движения) и прогнозирования (симуляция физики, транзитивный и композиционный вывод). Для калибровки сложности задач были установлены базовые показатели, основанные на результатах людей. 🟡Результаты. С простым визуальным восприятием, то есть с определение цвета или формы, все модели справляются отлично. Однако когда дело доходит до трехмерного пространственного мышления, динамики движения или временных последовательностей, начинаются серьезные проблемы. Выяснилась и другая любопытная деталь: VLM склонны «спутывать» физические понятия. Например, если в сцене изменить только цвет объекта, модель может внезапно ошибиться в оценке его размера или скорости. Оказалось, что цвет и форма являются самыми влиятельными атрибутами, которые искажают восприятие других, не связанных с ними характеристик. 🟡Но главная проблема кроется глубже. Точное восприятие мира совершенно не гарантирует точного прогноза. Исследование показало, что даже при идеально верном распознавании текущего состояния сцены модели проваливают предсказание физических взаимодействий. Разрыв с человеческими способностями явный: в задачах на транзитивный вывод он достигает 46%, а композиционный вывод выполняется на уровне случайного угадывания. 🟡Бенчмарк подсветил фундаментальный недостаток: У современных VLM отсутствуют базовые знания физики, необходимые для симуляции даже простейших событий. Они видят мир, но не понимают, по каким законам он живет. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Arxiv 🟡Датасет @ai_machinelearning_big_data #AI#ML#VLM#Benchmark#Maitrix