🚀 GLM-4.5V — новый лидер среди open-source моделей в визуальном рассуждении.
Модель показывает лучшие результаты в своём классе среди открытых решений, лидируя на 41 бенчмарке.
📌 Возможности:
- Image Reasoning — понимание изображений, анализ нескольких изображений, распознавание объектов.
- Video Understanding — раскадровка длинных видео, определение событий, которые происходят на кадрах из видео.
- GUI-задачи — понимание интрефейсов, распознавание иконок, кнопок и тд, помощь в управлении рабочим столом.
- Сложный анализ графиков и документов — разбор различных отчётов, извлечение информации их них.
- Grounding — точная локализация элементов на изображениях.
📌Особенности:
🟠 Основана на GLM-4.5-Air и использует наработки из GLM-4.1V-Thinking.
🟠 Архитектура — MoE с 106B параметров для эффективного масштабирования.
Здесь можно почитать про GLM-4.5, а здесь посмотреть техрепорт, там много интересного.
🟢 Hugging Face:http://huggingface.co/zai-org/GLM-4.5V
🟢GitHub: http://github.com/zai-org/GLM-V
🟢 Документация API: http://docs.z.ai/guides/vlm/glm-4.5v
🟢Попробовать: http://chat.z.ai
@ai_machinelearning_big_data
#GLM#opensource#vlm
⚡️GLM-5.1 вышел — open-source модель с топовым кодингом
Z AI представили GLM-5.1 — новую open-source модель с сильным фокусом на программирование и агентные задачи.
По заявлениям разработчиков, модель занимает:
🟡№1 среди open-source
🟡№3 в мире по совокупности бенчмарков (SWE-Bench Pro, Terminal-Bench, NL2Repo)
Главная фишка — автономность. Модель может работать до 8 часов подряд, сама улучшая стратегию и проходя тысячи итераций без вмешательства пользователя.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#glm#новости
⚡️GLM-5-Turbo — новая быстрая модель для агентных систем
Компания Z.ai представила GLM-5-Turbo — ускоренную версию модели GLM-5, которая оптимизирована для agent-driven окружений вроде OpenClaw. Главный фокус новинки — высокая скорость работы и стабильность в системах с AI-агентами, где модель должна быстро принимать решения и вызывать инструменты.
Модель уже можно использовать через OpenRouter, а разработчики опубликовали официальную документацию API с примерами интеграции. Также модель доступна в Coding Plan Max
Раскатка проходит поэтапно:
🟡Pro-пользователи получат GLM-5-Turbo уже в марте
🟡Lite-пользователи сначала получат GLM-5 в марте, а GLM-5-Turbo станет доступна в апреле
Тем, кому нужен доступ раньше, предлагают подать заявку на раннее тестирование:
Pro-доступ к GLM-5-Turbo можно запросить через форму Early Access, а Lite-доступ к GLM-5 — через отдельную форму.
Важно: текущая версия GLM-5-Turbo является экспериментальной и закрытой (closed-source). Разработчики отмечают, что все полученные результаты и улучшения позже будут перенесены в следующую open-source модель.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#glm#новости
⚡️GLM-4.6 вышла
GLM-4.6 — новая версия Z.AI с окном контекста 200K токенов (выход до 128K). Сделан упор на кодовые задачи, работу с инструментами и поиском, а также агентные сценарии и генерацию интерфейсов.
Доступен быстрый старт через API/SDK и профильные планы для разработки. Подробнее — в документации GLM-4.6.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#glm
⚡️GLM-5 вышла в веб чате Z AI
Пробуем тут - https://chat.z.ai/
Блог поста и бенчмарков пока нет
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#glm
🧵 Хочешь делать видео с нейросетями, но нет $300+ на пак нейронок в месяц?Есть рабочий лайфхак!
Veo2, FramePack, Runway — звучит круто, но что делать, если ты студент с дохлым ноутом и нулём на карте?
Я нашёл выход для тех, кто сейчас не может себе позволить платные нейросетки.
🎒 Мне всё чаще пишут:
— Где генеришь?
— Какой сервис юзать вместо Runway?
— Как попасть на Veo 2?
— Блин чёт дорого, а есть за бесплатно?
И вот что я говорю всем:
💸 Платные инструменты — лучше.
У них крутое качество, настройка, скорость.
Я сам за сервисы, если есть возможность.
Но если её нет...
🧬Тогда смотрим на Wan 2.1 Plus.
Это не замена платным нейросетям.
Это — вынужденный, но рабочий вариант.
Что умеет:
🦾 Бесконечные кредиты генераций
🦾 Хорошая физика объектов
🦾 Можно вставлять референсы
🦾 Дают временный доступ к редким фичам (смешивание кадров)
Минусы
🕐 Долгая генерация (больше 40 мин...)
#opensource | AcidCrunch
Китайцы выпустили открытый аналог Google Genie 3
Всего через 2 дня после анонса Genie 3 появилась его open-source альтернатива от Китая.
Нейросеть LingBot-World умеет в реальном времени (16 кадров/с) создавать из картинки или текста небольшой игровой мир, где можно управлять персонажем: на видео слева внизу видны кнопки wasd и видео меняется от их нажатия...
В отличие от закрытой разработки Google, код этой модели полностью открыт и доступен всем. Это большой шаг для независимых разработчиков.
#ИИ#нейросети#игры#opensource
https://t.me/semasci
🔥 Black Forest Labs представили FLUX.1 Kontext!
🔹 Генерация и точечное редактирование по тексту + исходному изображению
🔹 Консистентные персонажи и элементы сквозь итерации
🔹 Локальная правка фрагментов без смены всей сцены
🔹 Стиль по референсу и интерактивная скорость
⚙️ Три версии: Pro, Max (API, $0.08/картинка в Comfy), Dev (open-beta)
🌐 Тестируйте в Playground BFL – 200 бесплатных кредитов (1 gen = 4 кр.)
#ainews#opensource | AcidCrunch
🚀Рано списывать французов со счетов!
Mistral AI и All Hands AI выкатили Devstral 24B — лучшую открытую LLM для кодинга.
▫️46.8% на SWE-Bench (на 6% выше других открытых аналогов),
▫️ Влезает в RTX 3090 или Mac с 32GB RAM,
▫️ Агентная архитектура для работы с кодбазами (скафолдинг вместо ризонинга?),
▫️Apache 2.0 — можно применять даже в пром средах, без опасения юридических исков.
Скоро обещают модели крупнее, но вряд ли такие же открытые.
🔥 Веса: Hugging Face
📝 Подробности: Блог Mistral
https://t.me/semasci
#кодинг#opensource#ии
Mistral 3: мультимодальный, открытый, но... уже догоняющий
Французская Mistral AI выпустила семейство моделей Mistral 3. Главное:
✅ Mistral Large 3 (41B) — мультимодальная (текст+изображение), открытая (Apache 2.0). Похожа архитектурно на DeepSeek V3.
✅Ministral (14B, 8B, 3B) — тоже мультимодальные, компактные.
Но грустная правда: это не прорыв. Модель на бенчах лишь сравнивается с DeepSeek-V3.1 и Kimi K2, которые уже стали стандартом. Пока европейцы готовили релиз, в Китае вышла уже следующая итерация.
Архитектурное «вдохновение» у китайских коллег и скромные результаты делают релиз скорее шагом в догоняющих. В опенсорс-гонке ИИ Китай пока уверенно рулит, задавая темп и планку.
Европейский ИИ стабилен: круассаны есть, прорывов нет.
#MistralAI#ИИ#Opensource#LLM
https://t.me/semasci