#AI
Китайские ИИ-компании в поисках монетизации нацелились на зарубежные рынки.
Alibaba, ByteDance и другие крупные китайские компании стали запускать приложения на базе искусственного интеллекта не только для домашнего рынка, но и для глобальной аудитории, адаптируя свои продукты к различным рынкам.
По сообщению издания South China Morning Post со ссылкой на исследование Unique Capital, среди 1500 активных компаний в сфере ИИ по всему миру, 103 китайские фирмы уже начали расширяться на зарубежные рынки. Эта тенденция обусловлена сложностью в убеждении китайских пользователей платить за ИИ-сервисы, что побудило некоторые компании искать возможности роста за рубежом.
#AI
Google заключила сделку на $250 млн с Калифорнией для поддержки местных СМИ.
Вместо введения структуры сборов сделка будет привлекать финансирование от Google, налогоплательщиков и, возможно, других частных источников для создания двух программ: «Фонда трансформации новостей» и «Национального ускорителя инноваций в области ИИ». Согласившись на эту сделку, Google избегает счетов, которые заставили бы её платить издателям за публикацию их материалов на своих платформах.
Гильдия сценаристов США (Writers Guild of America Award, MGA) осудила сделку, назвав её вымогательством. «После двух лет агитации за принятие жёстких антимонопольных мер, чтобы начать обращать вспять упадок местных редакций, мы остались почти без слов. Издатели, которые утверждают, что представляют нашу отрасль, празднуют минимальные финансовые обязательства перед Google, чтобы вернуть богатство, которое эта монополия украла у наших редакций», — говорится в заявлении MGW.
#AI
Разработчики Midjourney запустили веб-приложение для генерации и редактирования изображений.
Функции генерации и редактирования были доступны в Discord. Пользователям приходилось поочерёдно отправлять несколько запросов, а сами функции были реализованы в виде команд чат-бота. Теперь для всего этого можно использовать веб-приложение.
Запросы для генерации можно отправлять в разделе Create. Рядом со строкой ввода есть кнопка настроек, в которых можно задать размер изображения, выбрать модель и указать стиль. Также доступен выбор скорости генерации. Бесплатно можно отправить 25 запросов, а каждый запрос генерирует по 4 изображения.
#AI
Инженеры китайской компании Alibaba представили мультимодальную модель машинного обучения.
С её помощью можно анализировать текст, изображения и видео. Разработчики делают упор именно на скорость работы нейросети, отмечая, что на обработку двухчасового видео уйдёт всего четыре секунды.
В основе mPLUG-Owl3 используется модель Qwen2, которую доработали и оптимизировали. Благодаря этому в шесть раз сократилось время ожидания первого токена, а на одной видеокарте A100 можно обрабатывать по 400 изображений в секунду.
#AI
Google анонсировала Imagen 3.
На портале arXive команда Google анонсировала модель машинного обучения Imagen 3, предназначенную для генерации изображений по текстовому описанию. Она заменит собой прошлую версию и будет доступна на сервисе ImageFX.
Нейросеть Imagen 3 по умолчанию создаёт изображения с разрешением 1024×1024 пикселей. При этом есть возможность увеличить разрешение в 2, 4 и 8 раз. В компании считают, что Imagen 3 лучше других моделей на рынке справляется с созданием фотореалистичных картинок и может обрабатывать длинные запросы со множеством деталей.
#AI
Google запустил режим голосового чата для Gemini — Gemini Live.
Доступная подписчикам Gemini Advanced функция включает несколько голосов и режим разговора, предусматривающий перебивание ассистента без нажатия кнопки. Компания впервые объявила о Gemini Live на конференции разработчиков I/O в начале этого года. Тогда же Google пообещал, что голосовой помощник сможет интерпретировать видео в реальном времени.
Google предлагает пользователям 10 голосов Gemini Live на выбор с именами вроде Ursa и Dipper. Сейчас функция доступна только на английском языке для Android-устройств. В ближайшие недели она появится на iOS и будет поддерживать больше языков.
Всем привет!
🎬 Представляю вам рекламный ролик по заказу отечественного фарм-производителя.
❗️Что сделали?
- придуман сценарий
- придуманы персонажи
- придуманы локации
- выполнена раскадровка
- созданы ключевые кадры
- обеспечена полная консистентность локаций и персонажей, голосов (обратите внимание на объекты, стоящие на столе в ресторане)
- подобраны голоса и фоновые звуки
- выполнена анимация
- выполнен монтаж и переходы
😱Сложности, с которыми столкнулись:
- текст на упаковке "плывет" при анимации.
- мимика персонажей имеет артефакты при разговоре (деформация губ и глаз).
Но не переживаем, все это мы победили 💪
Смотрим и наслаждаемся актерской игрой Ани и Ксюши 😃
Все выполнено с помощью AI, персонажи не настоящие.
Стек: Nano Banana PRO + VEO 3.1
#AI-фильм #AI-реклама
https://rutube.ru/video/f074ee05e3c2623dcc83c1d2a87fad92/
🤣Первого в мире ИИ-министра арестовали за взятку
Она проработала меньше трёх месяцев и за это время успела ещё забеременеть
Цифровой чиновник Диэлла в Албании получила 14 $BTC за «оптимизацию» тендеров на строительство скоростных магистралей
#AI-министр посчитала, что взятка — это стандартная процедура
Теперь обязанности Диэллы временно переданы старому калькулятору
В свою очередь, ИИ-адвокат министра сгенерировал заявление, в котором «оправдал действия своей клиентки» — по его словам, действия Диеллы были "стресс-тестом, а не коррупцией"
Ω😂🤖🤭
🗣DeepDen
#AI
Стартап Black Forest Labs выпустил модели генерации изображений FLUX.1
Стартап Black Forest Labs объявил о своём формировании и немедленно представил три модели для генерации изображений по текстовому промпту. FLUX.1, созданный выходцами из Stability AI, претендует на звание лучшей системы генерации изображений в индустрии.
В FLUX.1 задействована гибридная архитектура мультимодальных и параллельных диффузионных трансформерных блоков с 12 млрд параметров. Black Forest Labs заявляет, что достичь новых высот помогли техники flow matching, positional embeddings и parallel attention layers. На этом технические детали в посте стартапа кончаются, остальное обещают рассказать позднее.