TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #8110 · 21 июл.

🚀Qwen выпустила новую большую модель — Qwen3-235B-A22B-Instruct-2507-FP8! Qwen только что обновили свою флагманскую модель — Qwen3-235B-A22B, и это просто загляденье. Команда Qwen официально заявила, что отказывается от гибридного режима (Instruct + Reasoning в одной модели). Вместо этого они будут выпускать отдельные модели: одна для инструкций, другая для рассуждений. Сегодня вышла Instruct-версия, reasoning-модель уже в разработке. 📊Метрики впечатляют: - Обгоняет Kimi K2, у которого, между прочим, *триллион* параметров. - По ряду бенчмарков Превосходит Claude 4 Opus (non-thinking). - Особенно мощный прирост — в ARC-AGI ⚙️ Архитектура — MoE (Mixture of Experts), активных параметров всего 22B из 235B. То есть модель намного легче, чем кажется — она вполне реалистична для inference, особенно в FP8-режиме. 📜 Модель отлично справляется с: - Пониманием инструкций - Логическим выводом - Обработкой длинных контекстов до 256K токенов 💬 В будущем планируют дистилляцию в младшие версии, так что праздник будет не только для тех, у кого RTX 6000 на столе. 🟠HF: https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507 or https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 🟠ModelScope: https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Instruct-2507 or https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8 Модель действительно стала лучше. Qwen серьёзно заявляет о себе как об одном из лидеров open-source LLM. @ai_machinelearning_big_data #qwen#ml#ai#opensource

Результаты

Найдено 14 похожих постов

Earth&Climate Tech

@earth_climate_tech · Post #401 · 19.10.2023, 16:00

​​Polymathic - междисциплинарный ИИ Ох, какая классная межуниверситетская инициатива - Polymathic🔥. Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п. В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков. На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI. #AI#ML

Hashtags

🧵 Хочешь делать видео с нейросетями, но нет $300+ на пак нейронок в месяц?Есть рабочий лайфхак! Veo2, FramePack, Runway — звучит круто, но что делать, если ты студент с дохлым ноутом и нулём на карте? Я нашёл выход для тех, кто сейчас не может себе позволить платные нейросетки. 🎒 Мне всё чаще пишут: — Где генеришь? — Какой сервис юзать вместо Runway? — Как попасть на Veo 2? — Блин чёт дорого, а есть за бесплатно? И вот что я говорю всем: 💸 Платные инструменты — лучше. У них крутое качество, настройка, скорость. Я сам за сервисы, если есть возможность. Но если её нет... 🧬Тогда смотрим на Wan 2.1 Plus. Это не замена платным нейросетям. Это — вынужденный, но рабочий вариант. Что умеет: 🦾 Бесконечные кредиты генераций 🦾 Хорошая физика объектов 🦾 Можно вставлять референсы 🦾 Дают временный доступ к редким фичам (смешивание кадров) Минусы 🕐 Долгая генерация (больше 40 мин...) #opensource | AcidCrunch

Hashtags

Qwen выкатил интересную модель, которая разбивает обычные картинки на слои – как принято в этом вашем фотошопе Мда теперь нужно думать как эту тему вкорячить к себе в продукт) Вот тут детали, тут демо, модель уже в опенсорсе #qwen| AcidCrunch

Hashtags

ForgetMe | Нейросети

@forgetmeai · Post #5879 · 04.03.2026, 14:26

✴️В Qwen встряска: техлид Junyang Lin объявил об уходе сразу после релиза Qwen 3.5 Вокруг Qwen (Alibaba) разгорается история с неприятным послевкусием: Junyang Lin, которого называют техлидом и одним из ключевых лиц проекта, написал в X короткое «me stepping down. bye my beloved qwen» — без объяснения причин. Это случилось почти сразу после выхода Qwen 3.5 Small Model Series, из-за чего в комьюнити начались обсуждения, что произошло внутри команды. Дальше стало только громче: в ответах коллег появились намёки, что уход мог быть не совсем добровольным (возможные внутренние перестановки или политика после релиза). Параллельно СМИ пишут, что вслед за ним из Qwen ушли и другие заметные участники, включая руководителя пост-тренинга Yu Bowen, а ранее упоминался уход Hui Binyuan. При этом официального комментария Alibaba на момент публикаций не было. 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#qwen#новости

ForgetMe | Нейросети

@forgetmeai · Post #5777 · 26.01.2026, 17:03

✴️Вышла Qwen3-Max-Thinking — мощная модель frontier-уровня Qwen представили Qwen3-Max-Thinking, и по метрикам модель выглядит очень серьёзно Ключевые результаты бенчмарков: 🟡HLE 30.2 — примерно уровень Claude Opus 4.5, а с test-time-scaling обещают ещё выше 🟡SWE Verified 75.3 — немного ниже Opus, но на уровне Gemini 3 Pro 🟡IMO 83.9 — обходит Gemini 3 Pro, сильный результат по сложному рассуждению Помимо цифр, заявлены улучшенный tool calling и стабильное следование инструкциям, даже при работе с длинным контекстом. Попробовать модель: https://chat.qwen.ai/ 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5735 · 02.01.2026, 13:31

✴️Qwen-Image-2512: декабрьский апгрейд с упором на реализм и текст Команда Qwen подвезла праздничное обновление Qwen-Image-2512 — свежую версию декабрём, как раз к Новому году. Модель нацелена на более «живые» картинки и аккуратную работу с буквами в кадре, оставаясь в открытом доступе. Что улучшили: 🟡Люди выглядят естественнее. Ушёл характерный «ИИ-блеск», появились более детальные лица и мимика. 🟡Природа и материалы стали фактурнее. Трава, вода, шерсть и поверхности прорисовываются заметно резче. 🟡Текст в изображении — ровнее и точнее. Компоновка и попадание в макет стали предсказуемее, меньше артефактов. По итогам 10 000+ слепых сравнений на AI Arena модель заняла позицию сильнейшей среди open-source решений и уверенно держится рядом с закрытыми системами по качеству. Попробовать и скачать: 🟡Qwen Chat (t2i) 🟡Hugging Face — модель • Демо 🟡ModelScope — модель • Демо 🟡GitHub — репозиторий • Блог-анонс 🟡API (ModelStudio) 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5657 · 28.11.2025, 18:26

📛Новая модель генерации изображений от китайцев Вчера одна китайская лаборатория под покровительством Алибабы (qwen, wan и тд) представили Z-Image-Turbo (да она реально так называется). Качество генерации очень неплохое, но пока не выкатили версию под редактирование, но зато нет цензуры, подробнее: Линейка состоит из трёх вариантов (база — 6B), причём Turbo уже доступен и акцентирован на скорости и эффективности, а Base и Edit заявлены «скоро». 🟡Z-Image-Turbo (дистиллированная) — ~8 NFEs, субсекундная задержка на H800-классе, 16 ГБ VRAM достаточно; сильна в фотореализме, следовании промптам и двуязычном тексте. 🟡Z-Image-Base — недистиллированная версия для дообучения и кастомизации сообществом (скоро). 🟡Z-Image-Edit — специализация на редактировании (в т.ч. img2img по текстовым промптам, скоро). Где попробовать и почитать:Hugging Face: Z-Image-Turbo • Demo (HF Spaces) • GitHub (код и доки) • Comfy Workflow 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5370 · 05.10.2025, 10:34

✴️Qwen запускает персонализацию: Memory и кастомные системные инструкции В Qwen Chat начали поэтапно включать функции персонализации: Memory для запоминания важных фактов о ваших предпочтениях и custom system instruct для задания стиля и правил ответа на уровне всего диалога. Пока это ограниченное тестирование, доступ расширяют постепенно. Попробовать можно здесь: chat.qwen.ai. 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5284 · 25.09.2025, 03:41

🤖Qwen3-Max: новая вершина линейки Qwen для кода, агентов и сложных задач Qwen представила Qwen3-Max — на сегодня самую мощную модель семейства. Версия Qwen3-Max-Instruct заметно прибавила в программировании и агентных сценариях, а по уровню качества её уже сравнивают с флагманами рынка вроде ChatGPT 5 и Claude Opus 4. Что умеет на практике: 🟡 уверенно решает реальные задачи по разработке и выдаёт быстрый, рабочий код; 🟡 держит сложную логику и рассуждения, отвечает на вопросы, требующие глубоких знаний; 🟡 справляется с олимпиадной математикой и многошаговыми проблемами. Отдельно отметили Qwen3-Max-Thinking: в «тяжёлом» режиме модель показывает почти эталонные результаты. Рост обеспечили большие данные, мощные вычисления и RL-тренировка (обучение с подкреплением). Проверить в деле:Qwen Chat Подробнее о релизе:Пост в блоге Qwen 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5215 · 12.09.2025, 13:52

✴️Qwen3-Next-80B-A3B: «тонкий» 80B с активными 3B Представили Qwen3-Next-80B-A3B — модель на 80B параметров, у которой за каждый токен активируется лишь ~3B. За счёт такой сверхразреженной схемы обещают в 10 раз дешевле обучение и в 10 раз быстрее инференс, чем у Qwen3-32B, особенно на длинных контекстах 32K+. В основе — гибридная архитектура Gated DeltaNet + Gated Attention, совмещающая скорость и точность извлечения. По заявлению команды, Qwen3-Next-80B-A3B-Instruct по качеству подбирается к флагману 235B, а версия Thinkingобгоняет Gemini-2.5-Flash-Thinking на задачах рассуждения. Модель использует ультразряжённый MoE: 512 экспертов, 10 маршрутизируются + 1 общий, а также Multi-Token Prediction для «турбо» speculative decoding — это дополнительно ускоряет генерацию при длинном вводе и сложных запросах. Модель вышла сегодня ночью, но руки написать пост дошли только сейчас) Попробовать и почитать: 🟡Чат:chat.qwen.ai 🟡Блог:Анонс и технические детали 🟡Hugging Face:Коллекция Qwen3-Next 🟡ModelScope:Подборка Qwen3-Next 🟡Kaggle Models:Qwen3-Next-80B 🟡Alibaba Cloud API:Model Studio — Qwen 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5157 · 05.09.2025, 16:01

🤖Qwen3-Max-Preview: «триллионник» уже доступен в Qwen Chat и по API Alibaba Cloud (официальный релиз) Вышла Qwen3-Max-Preview (Instruct) — самая крупная модель Qwen (1T+ параметров). По внутренним и ранним пользовательским тестам она обходит прежний флагман Qwen3-235B-A22B-2507, заметно усиливая рассуждение, следование инструкциям, диалоги и агентные сценарии. Модель уже доступна: можно попробовать в Qwen Chat или подключить через Alibaba Cloud API. Команда заявляет, что масштабирование дало реальный прирост, а финальный релиз принесёт ещё больше улучшений. Qwen Chat:https://chat.qwen.ai Alibaba Cloud API:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-max-preview 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

12
НазадСтр. 1 из 2Вперёд