TGTGInsightаналитика telegramLIVE / telegram public index
← DevOps

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @DevOPSitsec · Post #1617 · 23 июл.

🚀 Qwen3-Coder — новая мощная open-source модель от Alibaba для кодинга Модель с архитектурой MoE: - 480B параметров в общей сложности - 35B активных параметров - Контекст 256k, но легко масштабируется до 1M токенов 📈 Производительность: - На уровне Claude 4 Sonnet - Лучше или на уровне GPT-4.1 на многих задачах - Обходит Kimi K2, DeepSeek V3 на ряде бенчмарков 🧩 Модель уже доступна: - На HuggingFace — можно скачать и запускать - В OpenRouter — $1/M токенов вход, $5/M выход (в 3 раза дешевле Claude Sonnet: $3 и $15) Попробовать бесплатно можно: 🟡Через чат: ttps://chat.qwen.ai/) 🟡GitHub link: https://github.com/QwenLM/qwen-code 🟡Blog:https://qwenlm.github.io/blog/qwen3-coder/ 🟡Model: https://hf.co/Qwen/Qwen3-Coder-480B-A35B-Instruct Qwen3-Coder — это просто одна из лучших моделей для программирования, которые мы когда-либо видели. #qwen#ml#ai#llm#Alibaba @data_analysis_ml

Результаты

Найдено 10,850 похожих постов

Общий глобальный поиск

Machinelearning

@ai_machinelearning_big_data · Post #8134 · 24.07.2025, 19:06

🧠 Qwen3-MT — Alibaba продолжает жечь и выпускает еще одну модель, в этот раз для машинного перевода. 🌍 Поддерживает 92+ языка, на которых говорит 95% населения мира 📚 Обучен на триллионах токенов из интернета, открытых документов и книгах, субтитров из видео. 🔬 Что внутри: - Модель Qwen3-MoE-72B с архитектурой Mixture-of-Experts - Заточена на переводческие фишки, поддерживает сложную терминологию и даже очень редкие слова. - RLHF: обучение с подкреплением повышает точность и естественность модели Возможности: ✅ Обеспечивает качественный перевод в реальном времени ✅ Контроль стиля и терминов ✅ Масштабируемость для API и продакшена ✅ Цена — от $0.5 за миллион токенов 🟡 Попробовать демку: https://huggingface.co/spaces/Qwen/Qwen3-MT-Demo 🟡 ModelScope: https://modelscope.cn/studios/Qwen/Qwen3-MT-demo 🟡 Документация API:https://alibabacloud.com/help/en/model-studio/translation-abilities 🟡 Блог с подробностями: https://qwenlm.github.io/blog/qwen-mt/ @ai_machinelearning_big_data #Qwen#Alibaba#ml#llm#ai

Machinelearning

@ai_machinelearning_big_data · Post #8122 · 23.07.2025, 09:03

🚀 Qwen3-Coder — новая мощная open-source модель от Alibaba для кодинга Модель с архитектурой MoE: - 480B параметров в общей сложности - 35B активных параметров - Контекст 256k, но легко масштабируется до 1M токенов 📈 Производительность: - На уровне Claude 4 Sonnet - Лучше или на уровне GPT-4.1 на многих задачах - Обходит Kimi K2, DeepSeek V3 на ряде бенчмарков 🧩 Модель уже доступна: - На HuggingFace — можно скачать и запускать - В OpenRouter — $1/M токенов вход, $5/M выход (в 3 раза дешевле Claude Sonnet: $3 и $15) 💬 Попробовать бесплатно можно: - Через чат: ttps://chat.qwen.ai/) - GitHub link: https://github.com/QwenLM/qwen-code Qwen3-Coder — это просто одна из лучших моделей для программирования, которые мы когда-либо видели. #qwen#ml#ai#llm#Alibaba @data_analysis_ml

Machinelearning

@ai_machinelearning_big_data · Post #8301 · 18.08.2025, 18:22

🔥 Qwen-Image-Edit — новый инструмент для умного редактирования картинок от Qwen Теперь можно не только генерировать изображения, но и редактировать их по команде: менять объекты, стиль, фон или даже текст прямо на картинке. Что умеет: - ✨ Редактировать смысл и детали — можно, например, повернуть объект, сменить цвет или стиль, не трогая остальное. - 🔤 Менять текст на картинках — добавлять, убирать или редактировать надписи на китайском и английском, при этом сохраняются шрифт и стиль. - 🏆 Лучшие результаты на тестах — модель показывает топ-уровень среди открытых решений. Как работает: Система сочетает понимание картинки (VL-модель) и точное управление структурой (VAE-кодировщик). Поэтому картинка сохраняет и смысл, и детали после правок. 🟢 Как попробовать: Достаточно открыть Qwen Chat и выбрать режим *Image Editing*. 🟠Попробовать: https://chat.qwen.ai/?inputFeature=image_edit 🟠Hugging Face: https://huggingface.co/Qwen/Qwen-Image-Edit 🟠ModelScope: https://modelscope.cn/models/Qwen/Qwen-Image-Edit 🟠Blog: https://qwenlm.github.io/blog/qwen-image-edit/ 🟠Github: https://github.com/QwenLM/Qwen-Image 🟠API (💰$0.03 за 1 редактирование): https://alibabacloud.com/help/en/model-studio/qwen-image-edit @ai_machinelearning_big_data #qwen#ml#llm#ai

Machinelearning

@ai_machinelearning_big_data · Post #8206 · 04.08.2025, 16:05

✔️Qwen-Image — новая открытая модель MMDiT 20B для генерации изображений. Особенно эффективна для создания картинок с нативным текстом. 🔍 Основные моменты: 🔹 Рендеринг текста SOTA показатели — конкурирует с GPT-4o на английском языке, лучший в своем классе на китайском языке 🔹 Двуязычная поддержка, разнообразные шрифты, понимает сложные промпты. Техотчёт показывает: - модель минимальные искажения символов при генерации; - заметно более высокие метрики качества изображения против «стандартных» диффузионок. 🎨 Можешь отлично справляется с созданием изображений в разных стилях — от фотореализма до аниме, от импрессионизма до минимализма. 🔘Blog: https://qwenlm.github.io/blog/qwen-image/ 🔘Hugging Face:https://huggingface.co/Qwen/Qwen-Image ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image 🔘Github:https://github.com/QwenLM/Qwen-Image 🔘Technical report:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-Image/Qwen_Image.pdf 🔘Demo: https://modelscope.cn/aigc/imageGeneration?tab=advanced @ai_machinelearning_big_data #qwen#ml#llm#ai

Machinelearning

@ai_machinelearning_big_data · Post #9220 · 10.12.2025, 15:45

🚀 Вышло крупное обновление Qwen3-Omni-Flash (версия 2025-12-01) Что изменилось: 🎙️ Модель намного лучше ведёт разговоры с голосом и видео - общение звучит естественно и непрерывно ✨ Теперь можно задавать характер ИИ через system prompts, например, стиль общения или роль 🗣️ Улучшена поддержка языков: 119 письменных и 19 голосовых 😊 Голоса звучат почти как настоящие люди Где попробовать: 🎙️ В Qwen Chat - нажмите VoiceChat или VideoChat (правый нижний угол): http://chat.qwen.ai 📝 Подробности в блоге: https://qwen.ai/blog?id=qwen3-omni-20251201 🎧 Онлайн-демо: http://hf.co/spaces/Qwen/Qwen3-Omni-Demo 🎧 Второе демо: http://modelscope.cn/studios/Qwen/Qwen3-Omni-Demo ⚡ Realtime API:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-omni-flash-realtime-2025-12-01 📥 Offline API:https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=qwen3-omni-flash-2025-12-01 @ai_machinelearning_big_data #Qwen#llm#ml

Hashtags

Machinelearning

@ai_machinelearning_big_data · Post #9779 · 30.03.2026, 14:09

🌟Alibaba выпустили Qwen3.5-Omni Не мультимодальную сборку из отдельных компонентов, а единую нативную архитектуру, которая с первого слоя работает с текстом, изображением, аудио и видео одновременно. Главное, что отличает модель от конкурентов: Audio-Visual Vibe Coding. Описываешь голосом в камеру что нужно сделать, модель генерирует рабочий код сайта или игры. Плюс Script-Level Captioning, который превращает видео в полноценный сценарий с таймкодами и привязкой реплик к спикерам. • По бенчмаркам Qwen3.5-Omni-Plus бьёт Gemini 3.1 Pro в большинстве категорий. • По распознаванию речи WenetSpeech: 4.30/5.84 против 11.5/14.2. • По пониманию аудио VoiceBench: 93.1 против 88.9. • • По зрению MVBench: 79.0 против 74.1. По тексту MMLU-Redux: 94.2 против 95.9 (тут паритет). Итого 215 SOTA-результатов по подзадачам. Модель корректно реагирует на перебивание и не ломается от фонового шума), встроенный WebSearch и Function Calling, поддержка 74 языков в ASR и 29 в TTS. Доступна через Qwen Chat, HuggingFace и API Alibaba Cloud. Qwenchat: https://chat.qwen.ai Blog: https://qwen.ai/blog?id=qwen3.5-omni Hugging Face Offline Demo: https://huggingface.co/spaces/Qwen/Qwen3.5-Omni-Offline-Demo Hugging Face Online Demo:https://huggingface.co/spaces/Qwen/Qwen3.5-Omni-Online-Demo @ai_machinelearning_big_data #ai#ml#qwen

Hashtags

Machinelearning

@ai_machinelearning_big_data · Post #9222 · 10.12.2025, 17:33

⭐️Nous Research открыла исходный код Nomos 1. При размере всего 30B параметров модель набрала 87/120 на Putnam - одном из самых престижных математических конкурсов в мире. Такой результат соответствовал бы 2-му месту среди 3988 участников в 2024 году. Nomos 1 показала 87/120 и восемь идеальных решений. Для сравнения: Qwen3-30B при тех же условиях получила 24/120. Это подчёркивает, что преимущество Nomos связано прежде всего с качеством обучения и данных, а не с тестовой средой. Проверка решений проходила вслепую: их оценивал реальный участник Putnam из топ-200, получивший обезличенные ответы. Задачи решались в тех же временных рамках, что и у участников - по 3 часа на каждую часть. Система рассуждений устроена так: — сначала “workers” решают наиболее сложные задачи и сами оценивают свои решения; — затем этап финализации, ИИ объединяет ответы и выбирает итоговый вариант. ▪HF: https://huggingface.co/NousResearch/nomos-1 ▪Github: https://github.com/NousResearch/nomos @ai_machinelearning_big_data #llm#ml#ai

Hashtags

Machinelearning

@ai_machinelearning_big_data · Post #9527 · 16.02.2026, 09:42

⚡️Релиз Qwen3.5-397B-A17B Это первый open-weight релиз в серии Qwen3.5. Лицензия Apache 2.0. Что интересного: • Мультимодальная модель Понимает текст и изображения • Создана для AI-агентов Оптимизирована для реальных задач: планирование, работа с инструментами, многошаговые действия. • Новая архитектура Hybrid Linear Attention + Sparse MoE + масштабное обучение с reinforcement learning. • Высокая скорость Заявлено что моделька примерно в 6- 9 раз быстрее, чем у предыдущей Qwen3-Max. • Глобальная модель Поддержка 201 языков и диалектов. Модели такого уровня в открытом доступе: - можно запускать AI у себя, без зависимости от API - полный контроль над данными - возможность строить собственных агентов и продукты - снижение стоимости на масштабах Qwen3.5-397B - реально в топе Модель либо: • на 1 месте, • либо рядом с GPT-5.2 / Claude Opus 4.5 / Gemini 3 Pro почти во всех бенчмарках. 🟡GitHub: https://github.com/QwenLM/Qwen3.5 🟡Чат: https://chat.qwen.ai 🟡Hugging Face: https://huggingface.co/collections/Qwen/qwen35 🟡Блог: https://qwen.ai/blog?id=qwen3.5 @ai_machinelearning_big_data #qwen#ai#llm#ml#opensource

tsuFeed

@tsuFeed · Post #8151 · 23.09.2025, 19:18

【做空多邻国!Qwen 同传模型来了】 Qwen 发了一个 3s 延迟,支持 18 种语言/方言,可根据视觉内容调整翻译的实时翻译模型 这个例子里的 Mask Mask Mask Musk 可以被精确翻译,太牛逼了!! #Qwen#Alibaba#AI $BABA https://fixupx.com/Alibaba_Qwen/status/1970566497312612361

TinyReadiviearning

@TinySnowDeprecatedCases · Post #16925 · 24.09.2025, 13:20

【做空多邻国!Qwen 同传模型来了】 Qwen 发了一个 3s 延迟,支持 18 种语言/方言,可根据视觉内容调整翻译的实时翻译模型 这个例子里的 Mask Mask Mask Musk 可以被精确翻译,太牛逼了!! #Qwen#Alibaba#AI $BABA https://fixupx.com/Alibaba_Qwen/status/1970566497312612361

Machinelearning

@ai_machinelearning_big_data · Post #8747 · 13.10.2025, 10:49

✔️Представлен новый метод для понимания работы больших языковых моделей — SAE Boost Метод помогает увидеть на какие внутренние признаки опирается ИИ, когда формирует ответы без переобучения всей модели. В основе — дополнительный автоэнкодер, который обучается на остаточной ошибке базовой модели и вылавливает редкие, специализированные сигналы, влияющие на решение модели. Sae Boost уже протестировали на тестах по химии, документах ООН и русскоязычном контенте – метод показал значительное улучшение качества реконструкции (explained variance) и снижения перекрестной энтропии LLM (LLM cross-entropy) на специализированных доменах. @ai_machinelearning_big_data #news#ai#ml#llm

Machinelearning

@ai_machinelearning_big_data · Post #8101 · 19.07.2025, 14:55

✔️T-Pro 2.0 — LLM с гибридным режимом рассуждений Т-Банк релизнул модель с гибридным ризонингом в опенсорс. T-Pro 2.0 дообучили на основе Qwen3 32B, улучшив качество и скорость генерации на русском языке. Вместе с моделью впервые выложили инструктивный датасет. Как дообучали модель сегодня рассказали на Turbo ML конфе и выложили на хабр. ✔️Дообучение модели T-Pro 2.0 проходило в несколько этапов. На основе токенизатора Qwen3 и с помощью расширения его кириллической части более, чем в 5 раз, разработчики получили улучшенный токенизатор для мультилингвальных моделей. По итогу токенизатор оказался на 30% более эффективен для русского языка. Затем за счет плотного токенизатора на двух доменах (чатовые запросы ru-arena-hard и олимпиадные математические задачи из T-Math) ускорили инференс. Следующим шагом было дообучение на большом русскоязычном инструктивном корпусе. Далее модель дообучали на более чистом SFT-сете, сформированном из разнообразных промптов, собранных вручную, из открытых источников и переводов англоязычных наборов данных. Для формирования итогового датасета ответы на инструкции генерировались с помощью более мощных моделей, таких как DeepSeek-V3 0324 и Qwen3-235B-A22B. Это позволило обеспечить высокий уровень точности и релевантности. На стадии Preference tuning для обучения DPO сформировали набор данных с фильтрацией по длине и типу для general-инструкций и сохранением баланса доменов для reasoning-инструкций. На финальном этапе Speculative decoding в качестве драфт- модели выбрали EAGLE 1 с генерацией драфта во время инференса с помощью tree attention согласно EAGLE 2. ✔️Бенчмарки моделей Для того, чтобы оценить способности моделей к ведению диалога, следованию инструкциям и решению задач разработчики использовали LLM-as-a-judge-арены: Arena Hard Ru, Arena Hard 2 и арену WildChat Hard Ru. В последней в качестве бейзлайна использовались ответы модели o3-mini, а “судьей” для всех арен выступал DeepSeek V3 0324. Для оценки знаний о мире и общим логическим способностям моделей на русском языке использовались бенчмарки MERA, MaMuRAMu, ruMMLU, ruMMLU-Pro. Бенчмарки AIME, MATH-500, GPQA Diamond, Vikhr Math, Vikhr Physics, LiveCodeBench v4_v5 позволили оценить способности reasoning-модели к рассуждениям и решению сложных задач. Англоязычные бенчмарки были целиком локализованы на русский язык ИИ-тренерами: ruAIME, ruMATH-500, ru GPQA Diamond, ruLCB. Компания также использовала свой бенчмарк Т-Math, чтобы расширить оценку математических способностей на русском языке. ✔️Задачи, которые закрывает T-Pro 2.0 Дообучение даже продвинутых LLM позволяет управлять стоимостью инференса и скоростью генерации, дообучать важные домены (саппорта или распределение внутреннего промтинга), уменьшить количества артефактов и проблем с русским языком. Модель T-Pro 2.0 доступна по лицензии Apache 2.0, ее можно бесплатно использовать как для решения задач в промптинге, так и для дообучения на свои задачи. ▪️Hugging face:T-Pro 2.0 Датасет T-wix @ai_machinelearning_big_data #news#ai#ml#llm

123•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••550•••600•••650•••700•••750•••800•••850•••900•••904905
НазадСтр. 1 из 905Вперёд