🧠 Qwen3-MT — Alibaba продолжает жечь и выпускает еще одну модель, в этот раз для машинного перевода.
🌍 Поддерживает 92+ языка, на которых говорит 95% населения мира
📚 Обучен на триллионах токенов из интернета, открытых документов и книгах, субтитров из видео.
🔬 Что внутри:
- Модель Qwen3-MoE-72B с архитектурой Mixture-of-Experts
- Заточена на переводческие фишки, поддерживает сложную терминологию и даже очень редкие слова.
- RLHF: обучение с подкреплением повышает точность и естественность модели
Возможности:
✅ Обеспечивает качественный перевод в реальном времени
✅ Контроль стиля и терминов
✅ Масштабируемость для API и продакшена
✅ Цена — от $0.5 за миллион токенов
🟡 Попробовать демку: https://huggingface.co/spaces/Qwen/Qwen3-MT-Demo
🟡 ModelScope: https://modelscope.cn/studios/Qwen/Qwen3-MT-demo
🟡 Документация API:https://alibabacloud.com/help/en/model-studio/translation-abilities
🟡 Блог с подробностями: https://qwenlm.github.io/blog/qwen-mt/
@ai_machinelearning_big_data
#Qwen#Alibaba#ml#llm#ai
📈 Академия DAMO компании Alibabaназвала искусственный интеллект основным трендом 2022 года.
По данным экспертов, за счет возможности обрабатывать огромные массивы информации ИИ способствует формированию новой парадигмы в исследованиях, выходящей за рамки экспериментальной и теоретической.
☝️ Также в академии заявили, что другим важными направлениями станут кремниевая фотоника и мягкая робототехника. Первое является перспективной альтернативой электронным полупроводникам, а второе — откроет новые возможности в использовании умных устройств в повседневной жизни.
#Alibaba
✴️Qwen3.6 35B A3B с дистилляцией под Opus 4.6 уже выложили в GGUF
Основа — Qwen3.6-35B-A3B, которую дообучили через LoRA, затем смержили в полный чекпоинт и перевели в GGUF. По карточке модели, обучение шло на reasoning-датасетах в стиле Claude Opus 4.6, а сам тюнинг был только текстовым — без дополнительного обучения на изображениях и видео.
Автор использовал три публичных reasoning-датасета, суммарно это около 14,2 тыс. примеров, обучал модель 2 эпохи с максимальной длиной последовательности 32 768 токенов. В GGUF уже лежат кванты Q4_K_M, Q5_K_M, Q6_K и Q8_0 размером 21,2 / 24,7 / 28,5 / 36,9 ГБ. Отдельно важно, что заявленный прирост в MMLU-Pro с 42,86% до 75,71% — это self-reported smoke-тест всего на 70 вопросах, а не полноценный большой релизный бенч, так что воспринимать это лучше как ранний сигнал, а не окончательный вердикт по качеству.
Источник: Hugging Face
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#llm#qwen
Официальный wechat-аккаунт технологического департамента #Alibabaрассказывает про технологию машинного перевода между китайским, английским и русским языками. Интересные примеры приводят (скриншот)
Polymathic - междисциплинарный ИИ
Ох, какая классная межуниверситетская инициатива - Polymathic🔥.
Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п.
В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков.
На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI.
#AI#ML
🎨 Alibaba представили мощное обновление для своего ИИ-художника — Qwen-Image 2512.
Команда серьезно прокачала модель, которую уже называют «убийцей Nano Banana». Ключевые улучшения направлены на фотореализм и детализацию.
Что стало лучше:
✅ Исчез «мыльный эффект», картинки выглядят четче и естественнее.
✅ Генерация текста на изображениях теперь работает намного точнее.
✅ Отрисовка шрифтов, текстур и шерсти вышла на новый уровень.
Теперь изображения от Qwen стали ещё убедительнее и детализированнее.
➡️Юзать нейронку можно бесплатно ТУТ.
#Alibaba#Qwen#Нейросети#ГенерацияИзображений#ИИхудожник#AI
🎄 С Новым годом, NeuroOffice!
⚡️Qwen представила Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507
Вышли две обновленные версии 4B-модели Qwen3 с упором на улучшенные навыки и работу с большим контекстом. (обновление от 6 августа)
🟡Qwen3-4B-Instruct-2507 — улучшенные общие способности, многоязычность, точное следование инструкциям на 256K токенов
🟡Qwen3-4B-Thinking-2507 — продвинутое рассуждение в логике, математике, науке и кодинге, для экспертных задач
Обе версии стали более выровненными, контекстно-чувствительными и точными в выводах.
Ссылки:
Hugging Face — Instruct | Thinking
ModelScope — Instruct | Thinking
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#новости#llm#нейросети#qwen
Qwen выкатил интересную модель, которая разбивает обычные картинки на слои – как принято в этом вашем фотошопе
Мда теперь нужно думать как эту тему вкорячить к себе в продукт)
Вот тут детали, тут демо, модель уже в опенсорсе
#qwen| AcidCrunch
✴️В Qwen встряска: техлид Junyang Lin объявил об уходе сразу после релиза Qwen 3.5
Вокруг Qwen (Alibaba) разгорается история с неприятным послевкусием: Junyang Lin, которого называют техлидом и одним из ключевых лиц проекта, написал в X короткое «me stepping down. bye my beloved qwen» — без объяснения причин. Это случилось почти сразу после выхода Qwen 3.5 Small Model Series, из-за чего в комьюнити начались обсуждения, что произошло внутри команды.
Дальше стало только громче: в ответах коллег появились намёки, что уход мог быть не совсем добровольным (возможные внутренние перестановки или политика после релиза). Параллельно СМИ пишут, что вслед за ним из Qwen ушли и другие заметные участники, включая руководителя пост-тренинга Yu Bowen, а ранее упоминался уход Hui Binyuan. При этом официального комментария Alibaba на момент публикаций не было.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#qwen#новости
✴️Вышла Qwen3-Max-Thinking — мощная модель frontier-уровня
Qwen представили Qwen3-Max-Thinking, и по метрикам модель выглядит очень серьёзно
Ключевые результаты бенчмарков:
🟡HLE 30.2 — примерно уровень Claude Opus 4.5, а с test-time-scaling обещают ещё выше
🟡SWE Verified 75.3 — немного ниже Opus, но на уровне Gemini 3 Pro
🟡IMO 83.9 — обходит Gemini 3 Pro, сильный результат по сложному рассуждению
Помимо цифр, заявлены улучшенный tool calling и стабильное следование инструкциям, даже при работе с длинным контекстом.
Попробовать модель:
https://chat.qwen.ai/
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#qwen
✴️Qwen-Image-2512: декабрьский апгрейд с упором на реализм и текст
Команда Qwen подвезла праздничное обновление Qwen-Image-2512 — свежую версию декабрём, как раз к Новому году. Модель нацелена на более «живые» картинки и аккуратную работу с буквами в кадре, оставаясь в открытом доступе.
Что улучшили:
🟡Люди выглядят естественнее. Ушёл характерный «ИИ-блеск», появились более детальные лица и мимика.
🟡Природа и материалы стали фактурнее. Трава, вода, шерсть и поверхности прорисовываются заметно резче.
🟡Текст в изображении — ровнее и точнее. Компоновка и попадание в макет стали предсказуемее, меньше артефактов.
По итогам 10 000+ слепых сравнений на AI Arena модель заняла позицию сильнейшей среди open-source решений и уверенно держится рядом с закрытыми системами по качеству.
Попробовать и скачать:
🟡Qwen Chat (t2i)
🟡Hugging Face — модель • Демо
🟡ModelScope — модель • Демо
🟡GitHub — репозиторий • Блог-анонс
🟡API (ModelStudio)
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#qwen
📛Новая модель генерации изображений от китайцев
Вчера одна китайская лаборатория под покровительством Алибабы (qwen, wan и тд) представили Z-Image-Turbo (да она реально так называется). Качество генерации очень неплохое, но пока не выкатили версию под редактирование, но зато нет цензуры, подробнее:
Линейка состоит из трёх вариантов (база — 6B), причём Turbo уже доступен и акцентирован на скорости и эффективности, а Base и Edit заявлены «скоро».
🟡Z-Image-Turbo (дистиллированная) — ~8 NFEs, субсекундная задержка на H800-классе, 16 ГБ VRAM достаточно; сильна в фотореализме, следовании промптам и двуязычном тексте.
🟡Z-Image-Base — недистиллированная версия для дообучения и кастомизации сообществом (скоро).
🟡Z-Image-Edit — специализация на редактировании (в т.ч. img2img по текстовым промптам, скоро).
Где попробовать и почитать:Hugging Face: Z-Image-Turbo • Demo (HF Spaces) • GitHub (код и доки) • Comfy Workflow
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#qwen
✴️Qwen3 Max Thinking на подлёте, релиз уже на этой неделе
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#qwen