Post content
🧠Baidu открыли ERNIE-4.5-VL-28B-A3B-Thinking Модель с 28B параметров и архитектурой A3B активирует лишь ~3B на шаг, но при этом показывает уровень топовых визуальных моделей. Подходит для задач, где нужно сочетать изображение, контекст и многошаговое рассуждение. Что умеет: - визуальное рассуждение: анализ диаграмм, многошаговая логика, причинно-следственные связи - STEM-задачи по фото: можно сфотографировать пример и получить решение - визуальное указание: точное определение объектов в сцене - детальный анализ изображения: фиксирует мелочи при масштабировании - вызов инструментов: например, Image Search - понимание видео: отслеживание событий по таймлинии Лицензия Apache 2.0. Модель: https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking @ai_machinelearning_big_data #ai#ml#Baidu