TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #8134 · 24 июл.

🧠 Qwen3-MT — Alibaba продолжает жечь и выпускает еще одну модель, в этот раз для машинного перевода. 🌍 Поддерживает 92+ языка, на которых говорит 95% населения мира 📚 Обучен на триллионах токенов из интернета, открытых документов и книгах, субтитров из видео. 🔬 Что внутри: - Модель Qwen3-MoE-72B с архитектурой Mixture-of-Experts - Заточена на переводческие фишки, поддерживает сложную терминологию и даже очень редкие слова. - RLHF: обучение с подкреплением повышает точность и естественность модели Возможности: ✅ Обеспечивает качественный перевод в реальном времени ✅ Контроль стиля и терминов ✅ Масштабируемость для API и продакшена ✅ Цена — от $0.5 за миллион токенов 🟡 Попробовать демку: https://huggingface.co/spaces/Qwen/Qwen3-MT-Demo 🟡 ModelScope: https://modelscope.cn/studios/Qwen/Qwen3-MT-demo 🟡 Документация API:https://alibabacloud.com/help/en/model-studio/translation-abilities 🟡 Блог с подробностями: https://qwenlm.github.io/blog/qwen-mt/ @ai_machinelearning_big_data #Qwen#Alibaba#ml#llm#ai

Результаты

Найдено 13 похожих постов

📈 Академия DAMO компании Alibabaназвала искусственный интеллект основным трендом 2022 года. По данным экспертов, за счет возможности обрабатывать огромные массивы информации ИИ способствует формированию новой парадигмы в исследованиях, выходящей за рамки экспериментальной и теоретической. ☝️ Также в академии заявили, что другим важными направлениями станут кремниевая фотоника и мягкая робототехника. Первое является перспективной альтернативой электронным полупроводникам, а второе — откроет новые возможности в использовании умных устройств в повседневной жизни. #Alibaba

Hashtags

ForgetMe | Нейросети

@forgetmeai · Post #6019 · 20.04.2026, 17:40

✴️Qwen3.6 35B A3B с дистилляцией под Opus 4.6 уже выложили в GGUF Основа — Qwen3.6-35B-A3B, которую дообучили через LoRA, затем смержили в полный чекпоинт и перевели в GGUF. По карточке модели, обучение шло на reasoning-датасетах в стиле Claude Opus 4.6, а сам тюнинг был только текстовым — без дополнительного обучения на изображениях и видео. Автор использовал три публичных reasoning-датасета, суммарно это около 14,2 тыс. примеров, обучал модель 2 эпохи с максимальной длиной последовательности 32 768 токенов. В GGUF уже лежат кванты Q4_K_M, Q5_K_M, Q6_K и Q8_0 размером 21,2 / 24,7 / 28,5 / 36,9 ГБ. Отдельно важно, что заявленный прирост в MMLU-Pro с 42,86% до 75,71% — это self-reported smoke-тест всего на 70 вопросах, а не полноценный большой релизный бенч, так что воспринимать это лучше как ранний сигнал, а не окончательный вердикт по качеству. Источник: Hugging Face 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#llm#qwen

​​Официальный wechat-аккаунт технологического департамента #Alibabaрассказывает про технологию машинного перевода между китайским, английским и русским языками. Интересные примеры приводят (скриншот)

Hashtags

Earth&Climate Tech

@earth_climate_tech · Post #401 · 19.10.2023, 16:00

​​Polymathic - междисциплинарный ИИ Ох, какая классная межуниверситетская инициатива - Polymathic🔥. Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п. В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков. На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI. #AI#ML

Hashtags

🎨 Alibaba представили мощное обновление для своего ИИ-художника — Qwen-Image 2512. Команда серьезно прокачала модель, которую уже называют «убийцей Nano Banana». Ключевые улучшения направлены на фотореализм и детализацию. Что стало лучше: ✅ Исчез «мыльный эффект», картинки выглядят четче и естественнее. ✅ Генерация текста на изображениях теперь работает намного точнее. ✅ Отрисовка шрифтов, текстур и шерсти вышла на новый уровень. Теперь изображения от Qwen стали ещё убедительнее и детализированнее. ➡️Юзать нейронку можно бесплатно ТУТ. #Alibaba#Qwen#Нейросети#ГенерацияИзображений#ИИхудожник#AI 🎄 С Новым годом, NeuroOffice!

ForgetMe | Нейросети

@forgetmeai · Post #4924 · 08.08.2025, 09:29

⚡️Qwen представила Qwen3-4B-Instruct-2507 и Qwen3-4B-Thinking-2507 Вышли две обновленные версии 4B-модели Qwen3 с упором на улучшенные навыки и работу с большим контекстом. (обновление от 6 августа) 🟡Qwen3-4B-Instruct-2507 — улучшенные общие способности, многоязычность, точное следование инструкциям на 256K токенов 🟡Qwen3-4B-Thinking-2507 — продвинутое рассуждение в логике, математике, науке и кодинге, для экспертных задач Обе версии стали более выровненными, контекстно-чувствительными и точными в выводах. Ссылки: Hugging Face — Instruct | Thinking ModelScope — Instruct | Thinking 🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI #новости#llm#нейросети#qwen

Qwen выкатил интересную модель, которая разбивает обычные картинки на слои – как принято в этом вашем фотошопе Мда теперь нужно думать как эту тему вкорячить к себе в продукт) Вот тут детали, тут демо, модель уже в опенсорсе #qwen| AcidCrunch

Hashtags

ForgetMe | Нейросети

@forgetmeai · Post #5879 · 04.03.2026, 14:26

✴️В Qwen встряска: техлид Junyang Lin объявил об уходе сразу после релиза Qwen 3.5 Вокруг Qwen (Alibaba) разгорается история с неприятным послевкусием: Junyang Lin, которого называют техлидом и одним из ключевых лиц проекта, написал в X короткое «me stepping down. bye my beloved qwen» — без объяснения причин. Это случилось почти сразу после выхода Qwen 3.5 Small Model Series, из-за чего в комьюнити начались обсуждения, что произошло внутри команды. Дальше стало только громче: в ответах коллег появились намёки, что уход мог быть не совсем добровольным (возможные внутренние перестановки или политика после релиза). Параллельно СМИ пишут, что вслед за ним из Qwen ушли и другие заметные участники, включая руководителя пост-тренинга Yu Bowen, а ранее упоминался уход Hui Binyuan. При этом официального комментария Alibaba на момент публикаций не было. 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#qwen#новости

ForgetMe | Нейросети

@forgetmeai · Post #5777 · 26.01.2026, 17:03

✴️Вышла Qwen3-Max-Thinking — мощная модель frontier-уровня Qwen представили Qwen3-Max-Thinking, и по метрикам модель выглядит очень серьёзно Ключевые результаты бенчмарков: 🟡HLE 30.2 — примерно уровень Claude Opus 4.5, а с test-time-scaling обещают ещё выше 🟡SWE Verified 75.3 — немного ниже Opus, но на уровне Gemini 3 Pro 🟡IMO 83.9 — обходит Gemini 3 Pro, сильный результат по сложному рассуждению Помимо цифр, заявлены улучшенный tool calling и стабильное следование инструкциям, даже при работе с длинным контекстом. Попробовать модель: https://chat.qwen.ai/ 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5735 · 02.01.2026, 13:31

✴️Qwen-Image-2512: декабрьский апгрейд с упором на реализм и текст Команда Qwen подвезла праздничное обновление Qwen-Image-2512 — свежую версию декабрём, как раз к Новому году. Модель нацелена на более «живые» картинки и аккуратную работу с буквами в кадре, оставаясь в открытом доступе. Что улучшили: 🟡Люди выглядят естественнее. Ушёл характерный «ИИ-блеск», появились более детальные лица и мимика. 🟡Природа и материалы стали фактурнее. Трава, вода, шерсть и поверхности прорисовываются заметно резче. 🟡Текст в изображении — ровнее и точнее. Компоновка и попадание в макет стали предсказуемее, меньше артефактов. По итогам 10 000+ слепых сравнений на AI Arena модель заняла позицию сильнейшей среди open-source решений и уверенно держится рядом с закрытыми системами по качеству. Попробовать и скачать: 🟡Qwen Chat (t2i) 🟡Hugging Face — модель • Демо 🟡ModelScope — модель • Демо 🟡GitHub — репозиторий • Блог-анонс 🟡API (ModelStudio) 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5657 · 28.11.2025, 18:26

📛Новая модель генерации изображений от китайцев Вчера одна китайская лаборатория под покровительством Алибабы (qwen, wan и тд) представили Z-Image-Turbo (да она реально так называется). Качество генерации очень неплохое, но пока не выкатили версию под редактирование, но зато нет цензуры, подробнее: Линейка состоит из трёх вариантов (база — 6B), причём Turbo уже доступен и акцентирован на скорости и эффективности, а Base и Edit заявлены «скоро». 🟡Z-Image-Turbo (дистиллированная) — ~8 NFEs, субсекундная задержка на H800-классе, 16 ГБ VRAM достаточно; сильна в фотореализме, следовании промптам и двуязычном тексте. 🟡Z-Image-Base — недистиллированная версия для дообучения и кастомизации сообществом (скоро). 🟡Z-Image-Edit — специализация на редактировании (в т.ч. img2img по текстовым промптам, скоро). Где попробовать и почитать:Hugging Face: Z-Image-Turbo • Demo (HF Spaces) • GitHub (код и доки) • Comfy Workflow 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

12
НазадСтр. 1 из 2Вперёд