⚡️Tencent выпустили новые open-source модели перевода HY-MT 1.5
Модель доступна в двух версиях: 1.8B и 7B. Обе работают как на устройстве, так и в облаке и показывают высокую скорость и точность.
Модель идет в двух размерах:
1) 8B для устройств
Оптимизирована под потребительское железо, занимает около 1 ГБ памяти.
Благодаря on-policy distillation достигает задержки 0.18 секунды на 50 токенов, обходя многие коммерческие API.
2) 7B новая SOTA
Превосходит большинство средних по размеру open-source моделей и сопоставима с закрытых решений.
Поддержка 33 языков и 5 китайских диалектов с высокой точностью.
Модели уже используются в сервисах Tencent. Связка двух моделей обеспечивает стабильную работу как на устройствах, так и в облаке.
🔹Попробовать: https://hunyuan.tencent.com/modelSquare/home/list
🔹GitHub: https://github.com/Tencent-Hunyuan/HY-MT
🔹Hugging Face: https://huggingface.co/collections/tencent/hy-mt15
@ai_machinelearning_big_data
#opensource, #Tencent,
🤖 CEO Tencent Пони Ма о раннем этапе развития холдинга, роли продаж и судьбе:
🛒 Мы постоянно пытались продать #Tencent, но никто не собирался покупать. Мы не могли продать QQ (первая социальная сеть компании, MAU до сих пор в районе 850 млн), поэтому продолжали развивать проект самостоятельно.
💸 Раньше в г.Шэньчжэнь не было VC. Нам повезло, что прямо перед крахом пузыря доткомов мы привлекли $2 млн.
🧵 Хочешь делать видео с нейросетями, но нет $300+ на пак нейронок в месяц?Есть рабочий лайфхак!
Veo2, FramePack, Runway — звучит круто, но что делать, если ты студент с дохлым ноутом и нулём на карте?
Я нашёл выход для тех, кто сейчас не может себе позволить платные нейросетки.
🎒 Мне всё чаще пишут:
— Где генеришь?
— Какой сервис юзать вместо Runway?
— Как попасть на Veo 2?
— Блин чёт дорого, а есть за бесплатно?
И вот что я говорю всем:
💸 Платные инструменты — лучше.
У них крутое качество, настройка, скорость.
Я сам за сервисы, если есть возможность.
Но если её нет...
🧬Тогда смотрим на Wan 2.1 Plus.
Это не замена платным нейросетям.
Это — вынужденный, но рабочий вариант.
Что умеет:
🦾 Бесконечные кредиты генераций
🦾 Хорошая физика объектов
🦾 Можно вставлять референсы
🦾 Дают временный доступ к редким фичам (смешивание кадров)
Минусы
🕐 Долгая генерация (больше 40 мин...)
#opensource | AcidCrunch
🔥 Black Forest Labs представили FLUX.1 Kontext!
🔹 Генерация и точечное редактирование по тексту + исходному изображению
🔹 Консистентные персонажи и элементы сквозь итерации
🔹 Локальная правка фрагментов без смены всей сцены
🔹 Стиль по референсу и интерактивная скорость
⚙️ Три версии: Pro, Max (API, $0.08/картинка в Comfy), Dev (open-beta)
🌐 Тестируйте в Playground BFL – 200 бесплатных кредитов (1 gen = 4 кр.)
#ainews#opensource | AcidCrunch
Китайцы выпустили открытый аналог Google Genie 3
Всего через 2 дня после анонса Genie 3 появилась его open-source альтернатива от Китая.
Нейросеть LingBot-World умеет в реальном времени (16 кадров/с) создавать из картинки или текста небольшой игровой мир, где можно управлять персонажем: на видео слева внизу видны кнопки wasd и видео меняется от их нажатия...
В отличие от закрытой разработки Google, код этой модели полностью открыт и доступен всем. Это большой шаг для независимых разработчиков.
#ИИ#нейросети#игры#opensource
https://t.me/semasci
🚀Рано списывать французов со счетов!
Mistral AI и All Hands AI выкатили Devstral 24B — лучшую открытую LLM для кодинга.
▫️46.8% на SWE-Bench (на 6% выше других открытых аналогов),
▫️ Влезает в RTX 3090 или Mac с 32GB RAM,
▫️ Агентная архитектура для работы с кодбазами (скафолдинг вместо ризонинга?),
▫️Apache 2.0 — можно применять даже в пром средах, без опасения юридических исков.
Скоро обещают модели крупнее, но вряд ли такие же открытые.
🔥 Веса: Hugging Face
📝 Подробности: Блог Mistral
https://t.me/semasci
#кодинг#opensource#ии
Сегодня с 16:00 по Москве здесь будет шумно — начнется Дзен-пятница. Воспользуюсь своим пекинским часовым поясом и расскажу несколько интересных моментов с конференции “CHina CHat 2018“, которая сейчас проходит в Шанхае.
Что за ивент?
Конференция преимущественно для иностранных компаний и брендов, которые хотят прийти на китайский рынок через соцмедиа и популярные приложения. Говорят о “social commerce”, в частности как продвигаться и продавать через #WeChat, #Douyin и прочие платформы.
О чем говорят?
🔸 Медиа-эксперт Мэтью Брэнан: со вступительным словом рассказал, как год назад все недоумевали насчет Douyin (Tiktok), а в 2018 это главный двигатель рынка. В целом речь о том, как не надо недооценивать тренды. Например, сейчас все обсуждают (но никто не пользуется) Bullet Messages. Тоже самое было с wechat mini-apps и некоторыми блогерами, которые сейчас стали мега-популярными (ванхунами).
🔸 В двух выступлениях ребята из #Tencent рассказали, какие возможности существуют в WeChat для брендов и компаний (в т.ч. иностранных), а также их внутренняя рекламная сеть (Social Ads), доступ к Big Data для таргетирования и анализа эффективности. А также: кейсы использования mini-apps, магазины в wechat, использование facial recognition и O2O.
🔸 Ashley Galina Dudarenok (агентство ChoZan) рассказывала о Douyin и продвижение в нем. MAU в июле 2018 уже 500 млн. Где, кто и когда смотрят видео на Douyin - данные по географии и пользователям. Нажмите ниже 🎵 если хотите подробный рассказ об этом.
🔸 Jenny Chen (агентство WalkTheChat): тренды social commerce (интернет-торговля и социальные сети). Как современные бренды используют соцмедия для маркетинга и продаж. Много разных кейсов, дам один пример: сеть кофеен Coffee Box. Они сделали приложение в вичате, в котором каждый пользователь может себе открыть виртуальную кофейню со своим брендом/дизайном и продавать кофе с доставкой. Естественно кофе доставляет «Кофибокс», но человек получает пару-тройку юаней комиссию за продажу (друзьям).
Также Jenny рассказала про ванхунов, они же KOL (key opinion leaders), как и на чем они зарабатывают в Китае. Нажмите 👩🎤 ниже, если хотите подробный рассказ об этом.
Дайджест по OpenSource ИИ новинкам этой недели, скажу так очень много бесплатного жира вышло, буду тестить.
⚙️EdgeTam
Сегментация и трекинг объектов в видео (до 16 FPS на смартфоне)
Кому полезно: AR/VR-девелоперам, мобильным видеоредакторам, стартапам в видеоанализе
🔗GitHub - ставим на комп
🖼ICEedit(⭐️Полезно)
Продвинутое редактирование изображений по тексту, обходит Gemini и GPT-4o (Интересно что по цензуре), так же доступно в ComfyUi.
Кому полезно: Дизайнерам, иллюстраторам, брендам и SMM-агентствам — быстрое создание вариаций изображений
🔗Инфо -изучаем
🔗Huggingface -тестим
🔗GitHub - ставим на комп
🎨Hydream E1(⭐️Полезно)
Стилизует, заменяет объекты и текст на изображениях, работает на базе Hydream (Лучший OpenSource генератор изображений на данный момент )
Кому полезно: Художникам, геймдеву, визуальным сторителлерам — создание стилизованных ассетов и артов
🔗GitHub - ставим на комп
🗣Fantasy Talking(⭐️Полезно)
Анимация лиц, тел и фонов по аудио — фотореалистичный deepfake из одного кадра. Очень годно! Считай бесплатный вариант недавно нашумевшего Omni Human
Кому полезно: Создателям персонажей, блогерам, разработчикам цифровых аватаров и игр
🔗GitHub - ставим на комп
🧠Qwen 3 - от 5B до 235B
Open-source LLM, сопоставимая (слегка мощнее) с GPT-o3 mini, имеет reasoning-режим
Кому полезно: Разработчикам ИИ, аналитикам, NLP-исследователям — автономная альтернатива GPT для локального и коммерческого использования
🔗Статья с ссылками
💡Microsoft Phi-4-reasoning
Компактная reasoning-модель (14B), близка к ведущим моделям при малых мощностях
Кому полезно: Учёным, медицинским работникам и т.д.
🔗Сайт - Изучаем
🔗 HuggingFace - Тестим (Только выбери модель из списка)
🌐Web Thinker(⭐️Полезно)
Автоматически ищет, анализирует и пишет отчёты по запросу — альтернатива DeepResearch
Кому полезно: Исследователям, студентам, журналистам, SEO-специалистам, очень хорош в научных исследованиях — глубокий ресёрч с фактчекингом
🔗Сайт - Изучаем
🔗Github - Ставим на комп
🎶Обновление Suno до v4.5
Генерация музыки с живым вокалом, динамикой и стилями, я не пользуюсь(предпочитаю udio), но очень хвалят
Кому полезно: Музыкантам, подкастерам, маркетологам — быстрое создание треков под стиль проекта
🔗Suno *v4.5 доступен в платной подписке
👇 Подпишись, сохрани и кидай друзьям
#opensource#digest | AcidCrunch
Mistral 3: мультимодальный, открытый, но... уже догоняющий
Французская Mistral AI выпустила семейство моделей Mistral 3. Главное:
✅ Mistral Large 3 (41B) — мультимодальная (текст+изображение), открытая (Apache 2.0). Похожа архитектурно на DeepSeek V3.
✅Ministral (14B, 8B, 3B) — тоже мультимодальные, компактные.
Но грустная правда: это не прорыв. Модель на бенчах лишь сравнивается с DeepSeek-V3.1 и Kimi K2, которые уже стали стандартом. Пока европейцы готовили релиз, в Китае вышла уже следующая итерация.
Архитектурное «вдохновение» у китайских коллег и скромные результаты делают релиз скорее шагом в догоняющих. В опенсорс-гонке ИИ Китай пока уверенно рулит, задавая темп и планку.
Европейский ИИ стабилен: круассаны есть, прорывов нет.
#MistralAI#ИИ#Opensource#LLM
https://t.me/semasci
Resemble AI — полностью опен-сорсный проект!
🔗Репозиторий
🔗Онлайн-демо
✨ Возможности
• Клонирование голоса по 5 секундам записи
• Точный контроль эмоций — от едва уловимых до драматических
• Синтез быстрее классического real-time инференса
• Встроенный водяной знак для защиты контента
🛠 Все под лицензией MIT: можно свободно использовать, модифицировать и встраивать в свои проекты.
#audiogen#opensource | AcidCrunch
🔥Minimax M1: Китайский ИИ, который учился за $534K — а делает как за $100M
Всего через полгода после триумфа DeepSeek R1 на сцену выходит Minimax M1 — новая open-source модель из Шанхая с контекстом 1 млн токенов и производительностью на уровне GPT-4o и Claude 3. Но главное — её обучение стоило всего $534 000 — в 200 раз дешевле, чем GPT-4o от OpenAI.
Почему это важно для нас?
1️⃣Бесплатно и открыто
M1 выложена в открытый доступ (Apache 2.0) — можно кастомизировать код, встраивать в свои продукты, учить на своих данных.
2️⃣Создаёт сложные проекты «в один клик»
Пишет чистый код, строит работающие сайты (например, виртуальный тур по Индии) с картами, API и логикой.
3️⃣Экономит ресурсы
Благодаря архитектуре Mixture-of-Experts и «молниеносному вниманию» (Lightning Attention) тратит на 75% меньше вычислений, чем аналоги.
4️⃣Уже работает
Доступна в двух версиях:
- M1-40K — для стандартных задач;
- M1-80K — для сложной аналитики и агентных сценариев.
👉Англоязычный разбор — в статье VentureBeat:
Minimax M1: Open-Source Model with 1M Token Context
💡Фишка поста: M1 не просто «ещё одна модель» — это доказательство, что дорогой ИИ — не значит лучший. Китайские стартапы бросают вызов гигантам вроде OpenAI, снижая порог входа в ИИ для всех.
#Minimax#ИИ#OpenSource#Китай#GPT
Пробуем здесь.
https://t.me/semasci