TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #113 · 27.12

Всегда мечтал быть тем чуваком, которому присылают тестовые версии устройств на зацен, ещё до поступления в продажу. И вот Сбер таки прислал. Год назад я писал о выходе SberPortal — умной колонки с экраном. Тогда казалось, что акцент у Сбера именно такой — обязательное наличие экрана даже при голосовом управлении. Но сейчас они выпустили voice-only устройство: SberBox Time. Нет, его всё ещё можно подключить к телевизору, но это не обязательно, и по факту колонка является чем-то средним между большой и маленькой Яндекс Станциями, с уклоном в большую: и звук помощнее, и HDMI есть. Устройство пока не продаётся, но некоторым разработчикам под Сбер выслали демонстрационные экземпляры. Стоит сразу отметить любопытную дизайнерскую находку — аналоговые часы вместо дисплея. Находка именно что любопытная. По факту сугубо на мой взгляд часы не являются ни шибко красивыми, ни тем более удобными. Определять по ним время тяжело, а из-за матового стекла лично у меня постоянно возникает желание настроить резкость. Однако, сама мысль скрещивать хайтек с чем-то более конвервативным звучит привлекательно. Возможно, я становлюсь старым, а может, просто устал от повсеместной цифровизации всего вокруг, но даже при субъективно спорном дизайне часики вполне приятно разместились на стеллаже. Впрочем, колонка пока что сырая — ложные срабатывания, неопределённо скачущая громкость, ошибки в ответах. К счастью, это всё исправляется апдейтами софта, а Сбер за прошедший год показал себя очень внимательным в вопросе фикса багов, и опередил здесь по скорости всех конкурентов. Посмотрим, что из этого выйдет. Прикольная мелочь: на офсайте SberBox Time предлагают скачать модели для 3D-печати и "надеть" на колонку всякие ушки, рожки, плавники, крылья итд. Я сначала подумал, что это полный бред, но для интереса распечатал, и надо сказать очень мило вышло, даже мне взрослому не хочется снимать, а уж дети то вообще должны быть в восторге (известно, что дети составляют значительную долю среди пользователей умных колонок). #gadgets

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #humanomniv2

当前筛选 #humanomniv2清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #7971 · 08.07.2025 г., 09:01

🌟HumanOmniV2: модель, которая понимает контекст видео. Alibaba Group разработали HumanOmniV2, модель на базе Qwen2.5-Omni-7B-thinker, которая получила навык осмысления визуального контекста за счет изменения самого процесса мышления модели. Ее научили следовать строгому формату: сначала описать контекст, потом рассуждать и только затем давать ответ. Теперь, прежде чем отвечать на вопрос, модель генерирует подробное описание сцены в теге <context>. На этом этапе она фиксирует, кто что делает, какой фон, какие звуки слышны. Только после этого в теге <think> она строит логическую цепочку рассуждений, связывая вопрос с собранным контекстом. И лишь в конце выдает результат в теге <answer> . Чтобы этот подход работал, его усилили системой вознаграждений на основе RL. За точность и правильный формат модель получает стандартные награды, но были введены и две новых: 🟢«Награда за контекст» дается, если его описание полное и релевантное, причем качество этого описания оценивает другая, более мощная LLM; 🟢«Логическая награда» проверяет, что в своих рассуждениях модель действительно использовала данные из видео и аудио, а не проигнорировала их. Для оценки HumanOmniV2 создали бенчмарк IntentBench (633 видео, 2689 вопросов) на основе Social-IQ 2.0, EMER и MDPE. Его фишка в том, что вопросы требуют одновременного анализа: видеоряда (жесты, микровыражения), диалогов (тон, смысл реплик) и социального контекста (ирония, обман, скрытые намерения). Тестовая модель обошла открытые аналоги на 3 бенчмарках: 🟠Daily-Omni: 58.47% (53.13% у MiniCPM-o 2.6); 🟠WorldSense: 47.1% (45.4% у Qwen2.5-Omni); 🟠IntentBench: 69.33% (64.20% у Qwen2.5-Omni). 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI#ML#MMLM#HumanOmniV2#Alibaba