📛 Вышла Uni-1.1
Luma представила Uni-1.1 и Uni-1.1 Max — новые модели для генерации и редактирования изображений. По архитектуре это decoder-only авторегрессионные трансформеры, которые работают с текстом и визуальной информацией напрямую, без склейки нескольких отдельных систем.
🟡единая последовательность токенов для текста и изображения, чтобы логика сцены и отрисовка шли в одном проходе;
🟡до 9 референсов за запрос для более точного сохранения лица, стиля и композиции;
🟡поддержка типографики, включая китайский, японский и арабский;
🟡1-е место в Human Preference Elo по стилю и генерации по референсам;
🟡 лидерство в RISEBench по пространственной логике;
🟡 среднее время генерации — около 31 секунды.
Обе версии уже доступны через API. Попробовать модель можно не только через arena.ai, но и напрямую на странице Luma Uni-1.
Luma Uni-1 | Попробовать в arena.ai
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#img#новости
✴️Вышла Images 2.0
OpenAI представила ChatGPT Images 2.0 — новое поколение генерации изображений с заметно лучшей работой по тексту, мультиязычной типографике, инфографике, постерам и layout-задачам. В официальных материалах модель показывают на примерах с плотным текстом, сложной версткой, комиксами, UI-сценами и изображениями на разных языках и письменностях.
По API модель идет как gpt-image-2. Она поддерживает произвольные размеры в рамках ограничений, вплоть до 4K, при этом максимальное соотношение сторон — 3:1, а все, что выше условного 2K, OpenAI помечает как экспериментальный вывод. Одновременно компания прямо пишет и про ограничения: даже после апдейта модель все еще может ошибаться в точном размещении текста, консистентности повторяющихся объектов и жестко заданных композициях.
В ChatGPT ImageGen 2.0 уже доступен на всех тарифах, а ImageGen 2.0 Thinking добавляет рассуждение, мультивывод и доступ к инструментам вроде web search — этот режим открыт на платных планах через Thinking и Pro. В Codex генерация тоже уже завязана на gpt-image-2. Отдельно интересно, что medium-версия gpt-image-2 уже вышла на первое место в arena.ai как в text-to-image, так и в image editing рейтингах.
Источник: OpenAI | Документация API | Arena Text-to-Image | Arena Image Edit
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#img#новости
📛Uni-1 от Luma — модель, которая «думает и рисует» одновременно
Luma представила Uni-1 — новую модель, которая объединяет генерацию изображений и reasoning в одном процессе. В отличие от классических text-to-image моделей, здесь система не просто рисует по описанию, а понимает сцену и принимает решения во время генерации.
Попробовать можно уже сейчас:
Uni-1 от Luma
Главная идея — так называемая Unified Intelligence архитектура. Это означает, что модель:
🟡 одновременно анализирует и генерирует изображение
🟡 учитывает логику сцены и физическую правдоподобность
🟡 может достраивать недостающие элементы осмысленно
Что умеет Uni-1:
🟡логичное дополнение сцен (например, корректно «додумывает» окружение)
🟡пространственное мышление — понимает, где что должно находиться
🟡управляемая генерация — можно задавать референсы и направлять результат
🟡учёт стиля и культуры — от мемов до манги
Также модель показывает сильные результаты в пользовательских тестах:
🟡1 место по общему качеству, стилю и редактированию
🟡1 место по генерации с референсами
🟡2 место в text-to-image
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#img#новости
👀LongCat-Video: опенсорс-модель для длинных видео без деградации качества
LongCat-Video — универсальная генеративная видеомодель с поддержкой txt2vid, img2vid и video-continuation. Архитектура заточена под длительное продолжение роликов: вместо накопления артефактов и «уползания» цветов модель держит стиль и детали на протяжении минут. Подробности и примеры — в LongCat-Video — страница проекта.
Почему это интересно: сочетание Coarse-to-Fine generation и Block Sparse Attention позволяет собирать 720p @ 30 fps за несколько минут, а обучение через Multi-Reward RLHF (GRPO) даёт конкурентные результаты на бенчмарках против ведущих open-source и коммерческих систем. На сайте есть Long Video Gallery — ролики длительностью до 4 минут.
Что умеет
🟡Длинные видео без «плывущих» цветов и потери резкости благодаря специализации на Video-Continuation.
🟡Эффективное вычисление: ускоренная генерация 720p/30fps (Coarse-to-Fine + Block Sparse Attention).
🟡Сильные метрики:Multi-Reward RLHF (GRPO) → превосходит эталонные бенчмарки.
🟡Интерактивные сценарии:разные промпты для сегментов (напр.: «женщина режет хлеб → наливает молоко → пьёт»; «мужчина работает → надевает наушники → закрывает ноутбук → встаёт»).
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#img
⚡️SynthID: скрытая водяная метка Google для ИИ-изображений
SynthID — это невидимая водяная метка, которую Google добавляет в пиксели изображения вместе с метаданными (и, вероятно, дополнительными признаками). Идея простая: сделать так, чтобы ИИ-картинки можно было надёжно распознавать, даже после базового редактирования — обрезки, изменения масштаба или лёгкой ретуши.
Зачем это нужно? Чтобы упорядочить использование генеративной графики и снизить риски: от этики и авторства до обучения будущих моделей. Метка «живёт» внутри изображения и помогает отличать синтетический контент от оригинального, а также поддерживает прозрачность происхождения.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#img#новости
⚡️Seedream 4.0 в DreaminaAI: 4K-качество, стабильность и до 6 референсов
Seedream 4.0 больше не только для API — модель стала доступна напрямую в интерфейсе DreaminaAI. Можно зайти, выбрать промпт и сразу тестировать без интеграций и SDK. Ссылка: DreaminaAI — генератор изображений.
Что улучшили: сверхчёткое 4K, более быструю и стабильную работу, а также поддержку до шести референсных изображений для комбинирования стилей и источников. Из приятного — бесплатный доступ до 9 октября, чтобы спокойно изучить качество и пайплайн.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#img
⚡️Hunyuan3D 3.0: точность ×3, геометрия 1536³ и UltraHD-воксели для детальных 3D-моделей
Hunyuan3D 3.0 от Tencent делает заметный рывок: заявлена в 3 раза более высокая точность, геометрическое разрешение 1536³ и воксельное моделирование UltraHD (3,6 КБ) — всё это даёт чище геометрию и больше мелких деталей при генерации и реконструкции по изображению.
Для практики это означает реалистичные лица и позы, лучшее совпадение с референсами и аккуратные текстуры на профессиональном уровне.
Что умеет:
🟡Послойная реконструкция по картинке: улавливает скрытые элементы сложных форм.
🟡Высокоточная мимика и анатомия: естественные контуры лица и позы.
🟡Плотные, ровные текстуры: улучшенное выравнивание и сверхчёткие детали.
Попробовать бесплатно (до 20 генераций):https://3d.hunyuan.tencent.com/
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#img#новости
⚡️ Вышел Ideogram Character — нейросеть, которая делает вашего персонажа из одного фото
Ideogram Character — это первая модель согласованности образа, которой достаточно одного эталонного изображения. Просто загружаете селфи или картинку, вводите текст — и нейросеть моментально создает персонажа.
Можно менять стиль, позу, фон или сцену. Хотите вставить себя в мем или мультик? Пожалуйста. Встроенная функция Magic Fill позволяет без проблем вставлять персонажа в любые сцены или арты.
Работает бесплатно. Уже доступно для всех пользователей — попробовать можно здесь: ideogram.ai
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#нейросети#img#новости
📛Hunyuan3D World Model 1.0 — первая в мире open-source модель для генерации интерактивных 3D миров
Tencent открыли код своей новой мощной нейросети, которая может создавать полноценные 3D-сцены всего по одному описанию или изображению. Модель подходит для VR, геймдева и симуляторов, а главное — встраивается в любые CG пайплайны, так что результат можно дорабатывать как угодно.
Ключевые фишки:
🟡Генерация 3D-мира по тексту или картинке
🟡Интерактивность: можно исследовать сцену в реальном времени
🟡Полная совместимость с 3D-редакторами
🟡 Подходит для VR, digital production и игр
🤖 Попробовать: 3d.hunyuan.tencent.com
⬆️ Сайт проекта: 3d-models.hunyuan.tencent.com
📄 Код: GitHub
📂 Модель: HuggingFace
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#нейросети#img#новости
🧠Gemini API: бесплатный доступ к gemini-2.5-flash-image на выходные
Google AI Studio открыла free-tier к Gemini API для модели gemini-2.5-flash-imageтолько на эти выходные. Отличная возможность быстро прогнать идеи и собрать прототипы генерации изображений без затрат.
На опенроутере также доступно бесплатно
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#img#gemini
✴️Google представила Gemini 2.5 Flash Image (nano-banana)
Google официально запустила Gemini 2.5 Flash Image — новую модель для генерации и редактирования изображений, известную также как nano-banana.
Ключевые особенности:
🟡сохранение консистентности персонажей;
🟡креативные и точные правки;
🟡 использование мировых знаний Gemini для контекстных генераций.
Попробовать модель можно бесплатно в приложении Gemini и в Google AI Studio, а также через Gemini API по цене $0.039 за изображение (тот же тариф, что и для 2.0 Flash Image Generation).
Разработчики отмечают, что качество генераций и уровень креативности заметно выросли — модель уже называют новой планкой для text-to-image.
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#новости#gemini#img#нейросети
⚡️Gemini 2.5 Flash Image замечен в API Vertex
Сейчас есть только gemini-2.0-flash-preview-image-generation
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#новости#gemini#img#нейросети