Содержимое
⚡️ Вышли новые версии Qwen3-Next-80B в формате FP8! 📌 Модели: - Qwen3-Next-80B-A3B-Instruct-FP8: 80B, обученная в формате Instruct. Сочетает MoE-архитектуру и FP8-квантование, при большом размере работает быстро и кушает меньше памяти, поддерживает длинный контекст - до 262k токенов (с расширением до миллиона) и оптимизирована для сложных задач рассуждения и работы с большими документами. - Qwen3-Next-80B-A3B-Thinking-FP8 — Thinking модель, с акцентом на рассуждения, и решение логических задач. Гибридное внимание: Gated DeltaNet + Gated Attention → работа с супердлинными контекстами. Thinking-версия** показывает топ-результаты на задачах рассуждений, обгоняя не только Qwen3-30B/32B, но и закрытую Gemini-2.5-Flash-Thinking - FP8-точность → быстрый инференс при сохранении качества. - Полная совместимость с Transformers, vLLM и SGLang. - Подходит для продакшн-задач, где важны скорость и эффективность. 🟠Hugging Face: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d 🟠ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a @ai_machinelearning_big_data #qwen#opensource#llm#ml