TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #702 · 15.12

Сайты "Комитета" (VC, DTF) обновили дизайн лайков и дизлайков. Раньше это была цифра с двумя стрелками-кнопками, как на Reddit, Хабре и Пикабу. Стрелка вверх добавляла посту или комментарию плюс, а стрелка вниз — минус. Сумма всех плюсов и минусов выводилась или зелёным, если она положительная, или красным с минусом, если отрицательная. Сейчас лайк сделали отдельной кнопкой слева, дизлайк — отдельной кнопкой справа, с другим дизайном. А счётчик показывает всем только лайки, а дизлайки только автору. Спорный тут и дизайн, и само решение. Дизайн понятно, почему: кнопки абсолютно разных стилей и в разных местах отвечают за принципиально похожие действия. Пользователи DTF уже вовсю стебутся комментами "Я скачал твой пост" (потому что кнопка дизлайка похожа на скачивание). Но куда хуже то, что дизлайки отображаются только автору. Они при таких условиях нафиг не нужны. Автор может просто игнорировать этот счётчик. Раньше, если какой-то человек сморозил чушь, толпа его массово минусует, и все это видят, и он сам знает, что все видят. С полным ртом минусов очень сложно как-то оправдываться и продолжать отстаивать свою точку зрения. Ещё и добавлялось удобство сканирования для читателей: комменты с минусами можно специально пропускать, или, допустим, специально останавливаться на них ради горячей дискуссии. У этой системы, разумеется, был серьёзный косяк: минусы получали не только те, кто говорил неверное или глупое мнение, но и те, кто говорил непопулярное мнение. Например, на VC лучше было не писать комментарии в поддержку России, даже если по смыслу тезис верный и просто передаёт какой-то факт, вроде "Россия одна из лучших в мире в области атомной энергетики". Это сводило обсуждения к тому, что люди либо молчали, либо подстраивались под принятую в сообществе идеологию, что могло, например, создавать ложные впечатления относительно количества поддерживающих ту или иную точку зрения, да и в целом не всегда способствовало образованию интересных обсуждений. Тем не менее, на мой взгляд, полное сокрытие дизлайков при наличии самой кнопки дизлайка — решение, которое берёт худшее от всех альтернатив. Сам по себе институт дизлайка остаётся (а, значит, остаётся выражение негатива), при этом с коллективной ответственности за негатив ("Мудаки меня травят, ну и фиг с ними, стадо баранов!") идёт перенос на личную ответственность за негатив ("Вася Иванов меня травит, найду козла и начищу ему харю!"). Причём, ещё и для пользователей от этого нет никакого толка: теперь кто угодно может писать что угодно, и в худшем случае публично получит за это ноль лайков и всё. Впрочем, в "Комитете" совершенно явный управленческий кризис (как и много где сейчас). Удивительно, что сайты хоть как-то ещё поддерживаются и даже вносятся изменения. #web

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #maitrix

当前筛选 #maitrix清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #7957 · 04.07.2025 г., 13:03

🌟WM-ABench: тестирование VL-моделей на понимание физики реального мира. Мaitrix Org разработали WM-ABench, бенчмарк для оценки VLM в качестве так называемых «моделей мира». Идея проста: проверить, насколько хорошо топовые модели способны не просто распознавать картинки, а понимать окружающую действительность и предсказывать ее изменения. Создатели, опираясь на когнитивную науку, создали фреймворк, который тестирует 15 самых популярных моделей по 23 параметрам, разделяя процесс на 2 ключевых этапа: восприятие и прогнозирование. В основе бенчмарка - огромный датасет из более чем 100 тысяч примеров, сгенерированных в 6 различных симуляторах, от ThreeDWorld и Physion до Carla. Чтобы модели не искали легких путей и не полагались на поверхностные совпадения, в тест добавили «сложные негативы» - контрфактические состояния, которые заставляют систему действительно анализировать происходящее. Весь процесс был разделен на оценку восприятия (распознавание объектов, пространства, времени, движения) и прогнозирования (симуляция физики, транзитивный и композиционный вывод). Для калибровки сложности задач были установлены базовые показатели, основанные на результатах людей. 🟡Результаты. С простым визуальным восприятием, то есть с определение цвета или формы, все модели справляются отлично. Однако когда дело доходит до трехмерного пространственного мышления, динамики движения или временных последовательностей, начинаются серьезные проблемы. Выяснилась и другая любопытная деталь: VLM склонны «спутывать» физические понятия. Например, если в сцене изменить только цвет объекта, модель может внезапно ошибиться в оценке его размера или скорости. Оказалось, что цвет и форма являются самыми влиятельными атрибутами, которые искажают восприятие других, не связанных с ними характеристик. 🟡Но главная проблема кроется глубже. Точное восприятие мира совершенно не гарантирует точного прогноза. Исследование показало, что даже при идеально верном распознавании текущего состояния сцены модели проваливают предсказание физических взаимодействий. Разрыв с человеческими способностями явный: в задачах на транзитивный вывод он достигает 46%, а композиционный вывод выполняется на уровне случайного угадывания. 🟡Бенчмарк подсветил фундаментальный недостаток: У современных VLM отсутствуют базовые знания физики, необходимые для симуляции даже простейших событий. Они видят мир, но не понимают, по каким законам он живет. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Arxiv 🟡Датасет @ai_machinelearning_big_data #AI#ML#VLM#Benchmark#Maitrix