TGTGInsighttelegram intelligenceLIVE / telegram public index
← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #8247

@ai_machinelearning_big_data

Machinelearning

Views26,700Post view count
PostedAug 1108/11/2025, 01:55 PM
Post content

Post content

🚀 GLM-4.5V — новый лидер среди open-source моделей в визуальном рассуждении. Модель показывает лучшие результаты в своём классе среди открытых решений, лидируя на 41 бенчмарке. 📌 Возможности: - Image Reasoning — понимание изображений, анализ нескольких изображений, распознавание объектов. - Video Understanding — раскадровка длинных видео, определение событий, которые происходят на кадрах из видео. - GUI-задачи — понимание интрефейсов, распознавание иконок, кнопок и тд, помощь в управлении рабочим столом. - Сложный анализ графиков и документов — разбор различных отчётов, извлечение информации их них. - Grounding — точная локализация элементов на изображениях. 📌Особенности: 🟠 Основана на GLM-4.5-Air и использует наработки из GLM-4.1V-Thinking. 🟠 Архитектура — MoE с 106B параметров для эффективного масштабирования. Здесь можно почитать про GLM-4.5, а здесь посмотреть техрепорт, там много интересного. 🟢 Hugging Face:http://huggingface.co/zai-org/GLM-4.5V 🟢GitHub: http://github.com/zai-org/GLM-V 🟢 Документация API: http://docs.z.ai/guides/vlm/glm-4.5v 🟢Попробовать: http://chat.z.ai @ai_machinelearning_big_data #GLM#opensource#vlm