TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
Machinelearning avatar

TGINSIGHT CHAT

Machinelearning

@ai_machinelearning_big_data

Технологии

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Подписчики31.3万Текущее число подписчиков
Постов1,009Проиндексировано постов
Охват99,600Просмотры последних постов
Последние посты

Последние посты

Тег: #glm · 4 постов

当前筛选 #glm清除筛选

Опубликован 27 мар.

GLM-5.1 теперь доступна для всех пользователей плана GLM Coding! http://z.ai/subscribe @ai_machinelearning_big_data #news#ai#ml#glm

21,300 views

Опубликован 20 янв.

🌟GLM-4.7 Flash: лайт-версия флагмана GLM-4.7. В полку моделей, тех, что можно запустить локально, не продавая почку, прибыло. ZAI выкатили GLM-4.7 Flash - облегченную версию GLM-4.7 на 30 млрд. параметров, с контекстным окном в 128К на архитектуре MoE. Со слов создателей, модель должна занять нишу между сегментом SLM и проприетарными мастодонтами, предлагая SOTA-уровень в кодинге. 🟡MoE Всего 30B, но активных параметров на токен гораздо меньше, официальной инфы нет, но в сообществе пишут, что 3 млрд. 🟡Interleaved Thinking Киллер-фича для агентов, которая досталась в наследство от старшей GLM-4.7. Обычно модели выплевывают весь свой CoT в начале, а вот эта техника дает возможность модели думать перед каждым вызовом инструмента. 🟡Файнтюн на эстетику и DevOps Опять-таки, со слов Zai, они натаскали GLM-4.7 Flash не просто писать валидный HTML/CSS, а использовать актуальные паттерны, нормальные отступы и цветовые схемы. Плюс, подтянули работу с CLI и девопс-задачами (понимает права доступа, навигацию по файловой системе). 🟡Цифры тестов выглядят как конфетка. В SWE-bench Verified модель выбивает 59.2%. Для сравнения: Qwen3-30B-A3B: 22.0%, GPT-OSS-20B: 34.0%. В математическом AIME 25 тоже обходит конкурентов - 91.6%. А вот на BrowseComp она лучше GPT-OSS-20B почти в 1.5 раза. Вобщем, Flash-версия выглядит как идеальный кандидат для локальных кодинг-агентов. Если есть пара свободных видеокарт (или есть стойкость терпеть квантование на одной), это, возможно, лучшая рабочая лошадка на сегодня. 📌Лицензирование: MIT License. 🟡Модель 🟡Квантованные варианты под все 🟡Demo1 🟡Demo2 @ai_machinelearning_big_data #AI#ML#LLM#GLM#ZAI

31,400 views

Опубликован 11 авг.

🚀 GLM-4.5V — новый лидер среди open-source моделей в визуальном рассуждении. Модель показывает лучшие результаты в своём классе среди открытых решений, лидируя на 41 бенчмарке. 📌 Возможности: - Image Reasoning — понимание изображений, анализ нескольких изображений, распознавание объектов. - Video Understanding — раскадровка длинных видео, определение событий, которые происходят на кадрах из видео. - GUI-задачи — понимание интрефейсов, распознавание иконок, кнопок и тд, помощь в управлении рабочим столом. - Сложный анализ графиков и документов — разбор различных отчётов, извлечение информации их них. - Grounding — точная локализация элементов на изображениях. 📌Особенности: 🟠 Основана на GLM-4.5-Air и использует наработки из GLM-4.1V-Thinking. 🟠 Архитектура — MoE с 106B параметров для эффективного масштабирования. Здесь можно почитать про GLM-4.5, а здесь посмотреть техрепорт, там много интересного. 🟢 Hugging Face:http://huggingface.co/zai-org/GLM-4.5V 🟢GitHub: http://github.com/zai-org/GLM-V 🟢 Документация API: http://docs.z.ai/guides/vlm/glm-4.5v 🟢Попробовать: http://chat.z.ai @ai_machinelearning_big_data #GLM#opensource#vlm

26,700 views

Опубликован 29 июл.

🌟GLM-4.5 и GLM-4.5-Air: релиз гибридных моделей, заточенных под агентные задачи. В новом семействе GLM, Z.AI объединили в одной модели возможности для рассуждений, кодинга и агентных сценариев. Семейство построено на архитектуре MoE и может работать в двух режимах: thinking mode для сложных задач с использованием инструментов и non-thinking mode для быстрых ответов. 🟡В релиз вошли: 🟢GLM-4.5 с 355 млрд. общих параметров (32 млрд активных) и ее облегченная версия; 🟠GLM-4.5-Air, облегченная версия со 106 млрд. общих параметров (12 млрд активных). Интересно, что разработчики пошли по пути увеличения глубины модели (количества слоев), а не ширины (скрытого измерения), так как обнаружили, что модели с большим количеством слоев лучше справляются с рассуждениями. 🟡 Для эффективного RL таких крупных моделей был разработан и открыт собственный фреймворкslime. Он поддерживает как синхронное, так и асинхронное обучение, что критически важно для агентных задач. Его инфраструктура полностью разделяет движки для роллаутов (сбора опыта) и движки для обучения, которые могут работать на разном железе. 🟡Главный акцент GLM-4.5 - агентные возможности. Для их оценки использовались 3 бенчмарка. На TAU-bench модель GLM-4.5 показала результат в 70.1 балла, что практически идентично Claude 4 Sonnet (70.3) и заметно лучше, чем у o3 (61.2). На бенчмарке для вызова функций Berkeley Function Calling Leaderboard v3 результат составил 77.8, снова опережая Claude 4 Sonnet с ее 75.2 баллами. Но самый показательный результат был на BrowseComp, сложном тесте для веб-браузинга. В нем GLM-4.5 набрала 26.4, что выше, чем у Claude-4-Opus (18.8) и почти как у o4-mini-high (28.3). Что касается классических задач на рассуждения, здесь модели показывают уверенные, хотя и не рекордные, результаты. На MMLU Pro у GLM-4.5 84.6 балла, чуть меньше, чем у Claude 4 Opus (87.3) и Grok 4 (86.6). В математическом тесте AIME24 модель набрала 91.0, ближайшие лидеры Qwen3 и Grok 4 - 94.1 и 94.3 соответственно. На GPQA разрыв побольше: 79.1 у GLM-4.5 против 87.7 у Grok 4, а на сложном тесте по научной литературе HLE модель получила 14.4 балла, уступив Gemini 2.5 Pro (21.1) и Grok 4 (23.9). В задачах, связанных с кодом, на тесте SWE-bench Verified модель набрала 64.2 балла, немного уступая Claude 4 Sonnet (70.4) и o3 (69.1), но опережая многие другие. А вот в агентном кодинге, который оценивался людьми с помощью Claude Code, картина иная. В прямом сравнении GLM-4.5 выигрывает у Kimi K2 в 53.9% случаев и обходит Qwen3-Coder с винрейтом 80.8%. Самый важный показатель - успешность вызова инструментов, где GLM-4.5 достигла 90.6%, опередив Claude-4-Sonnet (89.5%) и Kimi-K2 (86.2%). 📌Лицензирование: MIT License. 🟡Страница проекта 🟡Набор моделей 🟡Demo 🟡Сообщество в Discord 🖥GitHub @ai_machinelearning_big_data #AI#ML#GLM#MoE#ZAI

20,200 views