✔️Китай разрешил Alibaba, Tencent и ByteDance закупить 400 тыс. Nvidia H200.
Пекин дал добро, и это выглядит как вынужденный шаг назад. Регулятор пытается усидеть на двух стульях: с одной стороны стратегия импортозамещения, с другой - лидерам рынка нужно актуальное железо прямо сейчас, ведь на своих чипах далеко не уедешь.
Но ситуация запутанная. Источники Reuters говорят, что лицензии выдают с кучей жестких условий, которые даже не успели толком согласовать.
Один инсайдер выразился конкретнее: ограничения настолько суровые, что разрешение вроде бы есть, а превратить его в реальный заказ компании пока не могут. Впрочем, очередь за лицензиями все равно уже выстроилась.
reuters.com
✔️Figure AI создала нейросеть Helix 02 для управления роботами.
Компания показала, как робот Figure 03 загружает посудомойку - 61 действие подряд без сбоев. Раньше писали отдельные контроллеры для ног и рук, из-за чего любое движение корпуса сбивало прицел манипуляторам. Теперь всем телом управляет единая архитектура Helix 02.
Выглядит это пугающе естественно. За моторику отвечает сеть System 0 (10 млн. параметров), которую натаскали на 1000 часах человеческих движений. Она работает с частотой 1 кГц.
Инженеры говорят, что новый подход позволил удалить 109 тыс. строк кода, который раньше отвечал за координацию. Figure AI называет это самой сложной автономной задачей в истории гуманоидов.
figure.ai
✔️У Gemini появилось агентное зрение.
Раньше модель воспринимала изображение пассивно, а теперь она использует цикл «думай-действуй-наблюдай». Работает это так: если нужно рассмотреть мелкую деталь, Gemini сама пишет и исполняет код, чтобы приблизить, обрезать или разметить нужный участок. Это лечит старые болячки. Чтобы посчитать объекты, она теперь рисует рамки и нумерует их по порядку.
С таблицами то же самое: никаких галлюцинаций, только реальные вычисления через код. Google обещает прирост качества на 5–10%. Обновление уже раскатывают в AI Studio, Vertex AI и приложении Gemini (режим Thinking).
blog.google
✔️DecartAI выпустили Lucy 2.0, которая меняет видео на лету в 1080p.
В Full HD при 30 кадрах в секунду система успевает менять одежду, персонажей или фон по текстовому запросу практически, как говорят разработчики, без задержек. Модель работает без привычных 3D-движков и карт глубины. Она понимает физику движений, опираясь только на видео-паттерны. За стабильность картинки при длительной генерации отвечает алгоритм Smart History Augmentation.
Работает все на чипах AWS Trainium3 — видимо, только так удалось убрать задержки. В деле Lucy 2.0 можно попробовать тут.
decart.ai
✔️Рейтинг безопасности LLM от ADL: Claude лидирует, Grok провалил тесты на экстремизм.
Антидиффамационная лига (ADL) проверила, насколько легко современные модели выдают хейт-спич и экстремизм. Они прогнали 25 тыс. диалогов через 6 топовых моделей, и результаты оказались, мягко говоря, неоднозначными.
Лучше всех защищена Claude: 80 баллов из 100. А вот Grok с треском провалил тест, получив всего 21 балл. Самое слабое место Grok - работа с картинками и документами. В мультимодальных задачах он показал полный ноль: он просто не видит токсичный контент, если тот не написан текстом.
Итоговое распределение мест по убыванию: Claude, ChatGPT, DeepSeek, Gemini, Llama, Grok.
adl.org
@ai_machinelearning_big_data
#news#ai#ml
⚡️Microsoft начала внедрение ускорителя Maia 200.
Microsoft выкатывает 2 поколение собственного ИИ-чипа Maia, который должен снизить зависимость от Nvidia и оптимизировать расходы на инфраструктуру.
Ускорители уже поступают в дата-центры MS в США, а разработчикам открыли доступ к SDK, хотя сроки публичного запуска инстансов в Azure пока не названы.
Maia 200 — это решение на 3-нм техпроцессе, содержащее более 140 млрд. транзисторов. Архитектура специально заточена под инференс: заявлена производительность свыше 10 петафлопс в точности FP4 и 5 петафлопс в FP8.
Подсистема памяти включает 216 ГБ HBM3e с пропускной способностью 7 ТБ/с, дополненные 272 МБ сверхбыстрого SRAM-кэша на кристалле. TDP одного чипа составляет 750 Вт.
Maia 200 работает в 3 раза быстрее Amazon Trainium 3 и превосходит Google TPU v7 в FP8 (где чип выдает 5 петафлопс).
Архитектура оптимизирована под инференс и поддерживает бесшовное масштабирование в кластеры до 6144 ускорителей.
Новый чип запредельно эффективен экономически: показатель производительности на доллар у Maia 200 на 30% выше, чем у актуального железа конкурентов.
@ai_machinelearning_big_data
#news#ai#ml
✔️Claude научился управлять Slack, Figma и Asana прямо в чате.
Anthropic представила обновление для тарифов Pro, Team и Enterprise, превращающее ИИ-ассистента в хаб для рабочих процессов. Функция называется MCP Apps, и с ней Claude может сам накидать черновик сообщения в Slack, подправить диаграмму в Figma или обновить дедлайны в Asana.
Фишка релиза — визуальная нативность. Интерфейсы сторонних сервисов встраиваются прямо в диалог: вы видите не просто текст, а привычные виджеты (например, карточку задачи или окно мессенджера) и можете вносить правки, не выходя из интерфейса Claude.
Интеграции построены на МСP, они уже доступны в веб-версии и приложении Claude.
claude.com
✔️Moonshot AI релизнула Kimi K2.5.
Под капотом архитектура MoE на 1 трлн. общих и 32 млрд. активных параметров. Самое интересное - бета-функция Agent Swarm. Это оркестратор, который динамически создает и координирует до 100 субагентов. Причем прописывать сценарии заранее не нужно, они сами разбираются, что делать.
Кроме того, Kimi теперь может собрать интерактивный фронтенд прямо во время диалога. Что касается тестов, на бенчмарках HLE и SWE-Verified модель показывает себя очень бодро, при этом сам инференс стал дешевле.
Веса модели доступны на HuggingFace, а API полностью совместим со стандартами OpenAI и Anthropic. Для локального запуска рекомендуют vLLM, SGLang или KTransformers.
kimi.com
✔️Google запустила бюджетную подписку AI Plus.
Стоимость подписки составляет $7,99 в месяц (в некоторых регионах цена ниже — около $4,5). Она доступна везде, где есть доступ к ИИ от Google.
Это явный ответ на недавний запуск ChatGPT Go и Google метит ровно в ту же нишу — между бесплатным тиером и $20/мес. В пакет вошли: Gemini 3 Pro, Nano Banana Pro, Veo и NotebookLM. Плюс насыпают 200 ГБ в облаке.
В тарифе есть семейный доступ: подписку можно расшарить на пятерых. Приятный сюрприз ждет тех, кто уже платит за 2 ТБ в Google One — им все фишки AI Plus добавят автоматически и без доплаты, а для новых пользователей на старте действует скидка 50% на первые два месяца.
blog.google
✔️OpenAI продает рекламу в ChatGPT по цене как на топовых спортивных трансляциях.
Компания начала размещать рекламные блоки под ответами чат-бота на тарифах Free и Go. CPM превышает средние расценки в интернете и находится на уровне рекламы во время трансляций американского Суперкубка или матчей NFL.
OpenAI выбрала модель оплаты за показы, а не за клики. Это объясняется спецификой взаимодействия с LLM: пользователи гораздо реже переходят по внешним ссылкам, чем в поиске.
Еще недавно Сэм Альтман называл рекламу "последней мерой" и "антиутопией", но необходимость монетизации для оправдания высокой оценки компании вынудила пересмотреть стратегию.
theinformation.com
✔️Вице-президент и CISO OpenAI Мэтт Найт покидает компанию.
Найт, первым штатный специалист по кибербезопасности в OpenAI, объявил о своем уходе. Он присоединился к команде в 2020 году, когда компания представляла собой небольшую лабораторию, занятую запуском GPT-3 и экспериментального API.
Найт с нуля выстроил архитектуру безопасности, которая сегодня защищает сотни миллионов пользователей и критически важные ИИ-системы. Топ-менеджер отметил, что гордится своим вкладом в создание стандартов защиты для новой эры ИИ, но про дальнейшие карьерные планы ничего не сообщил.
Matt Knight в сети Х
@ai_machinelearning_big_data
#news#ai#ml
⚡️OpenAI Prism: научный редактор на базе GPT-5.2 с поддержкой LaTeX.
OpenAI наконец-то пустила в дело наработки купленного стартапа Crixet и это очень хорошая попытка создать идеальное рабочее место для ученых, где не нужно прыгать между десятью вкладками.
Если вы когда-нибудь писали статью, то вам знакомо, когда в одном окне Overleaf, в другом - ChatGPT, в третьем - arXiv, а где-то сбоку еще болтается менеджер ссылок. Контекст постоянно теряется, а копипаст формул туда-сюда рано или поздно приводит к ошибкам.
Так вот, Prism соберет все это в одну кучу и это не просто чат в боковой панели. Он видит всю структуру вашей статьи: уравнения, библиографию и графики.
Можно запустить режим Тhinking и попросить модель, например, переписать сложную формулу или поправить логику в конкретном абзаце. При этом правки вносятся прямо в текст, так что копировать куски кода из чата больше не придется.
🟡Еще из полезного
🟢Можно сфотографировать наброски формул или диаграмм с маркерной доски, и Prism сама перегонит их в LaTeX.
🟢Связь с arXiv: искать литературу и вставлять цитаты можно прямо во время написания черновика.
🟢Голосовые правки - если лень тянуться к клавиатуре, простые изменения можно надиктовать.
🟢Совместная работа: можно добавить сколько угодно соавторов, и никто не будет бомбить от конфликта версий.
Самое приятное - базовую версию Prism сделали бесплатной для всех.
@ai_machinelearning_big_data
#news#ai#ml
✔️OpenAI: 1,3 млн. ученых используют ChatGPT для науки.
OpenAI поделилась внутренней статистикой внедрения своих инструментов в академическую среду: каждую неделю около 1,3 млн. человек обсуждают с ChatGPT продвинутые научные вопросы. Всего за 2025 год объем таких дискуссий вырос на 47%. Чаще всего ChatGPT просят помочь с Computer Science, Data Science и с алгоритмами ИИ.
Вице-президент по науке Кевин Вейл уверен, что мы наблюдаем переломный момент. Ученые перестали воспринимать чат-бота как поисковик и стали доверять серьезные задачи: от интерпретации сложных данных до планирования экспериментов.
Самое любопытное в отчете - упоминание возможностей GPT-5.2. В OpenAI заявляют, что новая модель переросла уровень школьных олимпиад и теперь она способна на настоящие математические открытия, уже находя применение в вычислительной химии и физике частиц.
axios.com
✔️Tencent релизнула Img-2-Img модель Hunyuan Image 3.0-Instruct.
Новинка заточена под задачи редактирования и синтеза по рефенернсам. Под капотом - MoE на 80В общих 13B активных параметров.
Модель наделили продвинутым семантическим пониманием через ризонинг: получив картинку и промпт, она анализирует контекст, декомпозирует задачу на шаги и точечно вносит правки, не искажая исходную композицию. За консистентность неизменяемых областей отвечает собственный алгоритм MixGRPO.
Tencent насчитал более 80 сценариев использования. Среди них - реставрация старых снимков, сложный фьюжн объектов с разных фото, стилизация и замена текста на изображении с сохранением оригинальной верстки. Модель доступна только в веб-сервисе Tencent.
Tencent в сети X
✔️Google купила стартап Common Sense Machines.
Google подтвердила поглощение стартапа, который создавал генеративные модели для преобразования изображений в 3D-ассеты. Команда инженеров стартапа в полном составе переходит в Google DeepMind.
Для одного из основателей CSM, Теджаса Кулкарни, это возвращение домой. До того, как запустить свой бизнес в 2020 году, он работал научным сотрудником в том же DeepMind.
Сколько именно Google заплатила за стартап — неизвестно, но на прошлых этапах инвесторы оценивали компанию примерно в $15 млн.
theinformation.com
✔️Luma AI обновила свою видео-модель Ray до версии 3.14.
Главное изменение: теперь не нужно жертвовать скоростью ради качества или наоборот. Модель выдает 1080p без использования апскейлеров, при этом работает в 4 раза быстрее предыдущей версии.
Разработчики сделали упор на стабильность картинки в задачах анимации и video-to-video. Ray 3.14 лучше держит персонажей: они меньше искажаются и не меняются от кадра к кадру.
Для профессионального продакшена важным моментом станет цена - стоимость генерации упала в 3 раза. Обновление уже доступно в Dream Machine и у партнеров: Adobe и AWS.
lumalabs.ai
✔️Nvidia, по слухам, отказалась от MSRP.
Nvidia, предположительно, свернула программу Official Pricing Program. Этот механизм обязывал партнеров-производителей выпускать определенный объем видеокарт по рекомендованной розничной цене. Если инсайд подтвердится, понятие MSRP фактически утратит смысл и станет чистой формальностью.
Теперь вендоры освобождаются от жестких ценовых рамок и смогут формировать стоимость устройств, опираясь исключительно на рыночный спрос и собственную маржинальность.
Учитывая опыт прошлых лет и ажиотаж вокруг ИИ-железа, эксперты опасаются возвращения дикого рынка с кратным завышением ценников уже в ближайшее время. Официальных комментариев от Nvidia пока не поступало.
techpowerup.com
@ai_machinelearning_big_data
#news#ai#ml
⚡️OpenAI Town Hall: что было на трансляции.
Пока ну почти все спали, Сэм Альтман провел анонсированный ранее стрим для разработчиков ИИ.
В течении часа глава OpenAI отвечал на вопросы и рассказывал про видение ИИ сейчас и в будущем. Главный тезис стрима:
Мы входим в эпоху "радикального изобилия", где интеллект станет слишком дешевым, чтобы его измерять.
Сэм Альтман прогнозирует, что к 2027 году стоимость инференса упадет в 100 раз, а модели уровня GPT-5.ХX станут основой для создания сложнейшего софта силами одного человека.
Основным дефицитным ресурсом останется человеческое внимание и способность генерировать качественные идеи.
Ключевые моменты трансляции
🟡Трансформация инженерии и экономики
Удешевление создания кода не снизит спрос на программистов, а наоборот, резко увеличит объем создаваемого софта. Инженеры будут тратить меньше времени на код и больше на проектирование.
ИИ станет дефляционным фактором. Софт, на разработку которого раньше уходили годы работы команд, теперь можно создать за пару сотен долларов инференса и одну хорошую идею.
Значительная часть мирового ВВП будет создаваться и потребляться через софт, генерируемый ИИ.
🟡Планы по GPT
Цель — сделать интеллект "too cheap to meter". К концу 2027 года ожидается появление моделей уровня 5.2X со снижением стоимости в 100 раз.
Скорость важнее цены. Разрабатываются методы выдачи результата в 1/100 времени от текущего, даже если это будет стоить дороже.
В GPT-4.5 был упор на текстовый стиль. В GPT-5 команда сместила фокус на "ризонинг, кодинг и инжиниринг". Альтман признает, что сейчас стиль может казаться громоздким, но это исправят в будущих итерациях.
🟡Агенты и персонализация
Будущее за приложениями, которые пишутся на лету под конкретного пользователя, т.е софт, который эволюционирует вместе с вашими привычками.
Готовится функция «Sign in with ChatGPT», которая позволит передавать ИИ контекст всей цифровой жизни пользователя (почта, файлы, история), чтобы он мог действовать как полноценный ассистент.
Обсуждается создание иерархии памяти: рабочая идентичность, личная и т.д., чтобы модель знала, какой контекст использовать в разных ситуациях.
🟡Безопасность и риски
Модели становятся слишком хороши в биологии. Старая стратегия блокировки доступа скоро перестанет работать. Нужен переход к стратегии устойчивости, как в пожарной безопасности.
Альтман признался, что сам быстро перешел от "никогда не дам ИИ доступ к компьютеру" до "пусть делает всё сам", потому что удобство перевешивает страх. Это создает риск скрытых уязвимостей, которые могут проявиться через недели работы агента.
🟡Инсайты и рекомендации
Стройте продукты, предполагая, что GPT-6 будет «невероятным». Если ваш бизнес выиграет от новой модели - вы на верном пути. Если модель его съест - это плохой путь.
Софт-скилс - самые важные навыки сейчас: высокая субъектность, способность генерировать идеи, устойчивость и адаптивность.
Альтман советует амбициозным разработчикам ИИ уходить из университетов, так как текущая академическая среда не успевает за темпами индустрии.
Используйте ИИ как безлимитного аспиранта или партнера по брейн-шторму для проверки тысяч идей в режиме "поиска в ширину".
@ai_machinelearning_big_data
#news#ai#ml
⚡️OpenAI будет стримить митап на Youtube 28 января.
Сэм Альтман анонсировал в X, что на собрании разработчиков будет обсуждение "инструментов нового поколения", которые начинает создавать OpenAI.
Стрим нового формата (собрание с трансляцией в прямом эфире) запланирован на 3:00 МСК 28 января на Youtube.
Ваши ставки - что такое инструменты нового поколения?
@ai_machinelearning_big_data
#news#ai#ml
📌ИИ в Давосе-2026.
Всемирный экономический форум в Давосе на этой неделе превратился в парад прогнозов про ИИ: лидеры топовых компаний поделились своими совершенно разными взглядами на будущее.
Вот что говорили отцы индустрии:
🟡Илон Маск (xAI)
К концу этого года у нас может появиться ИИ умнее любого человека, скажу, что не позже следующего года.
Будущее — это гуманоидная робототехника, и у каждого будет робот.
Есть проблема в энергоснабжении для ИИ, но в Китае этого не произойдет, так как он развертывает более 100 ГВт солнечной энергии в год.
🟡Дженсен Хуанг (NVIDIA)
ИИ — это уникальная возможность для Европы, которая может перепрыгнуть через программную эпоху и объединить свои производственные возможности для создания инфраструктуры ИИ.
ИИ создаст множество рабочих мест, связанных с ручным трудом: сантехников, электриков и строителей. Их зарплаты уже растут почти вдвое. Для этого не нужна докторская степень.
🟡Сатья Наделла, (Microsoft)
Мы как глобальное сообщество должны прийти к тому, чтобы использовать ИИ для чего-то полезного, что меняет жизнь людей, стран и отраслей.
Внедрение ИИ будет неравномерно распределено по всему миру, в первую очередь из-за ограничений, связанных с доступом к капиталу и инфраструктуре.
🟡Демис Хассабис (Google DeepMind)
Я ожидаю создания новых, более значимых рабочих мест. Студентам стоит использовать время для освоения новых инструментов, а не для стажировок — это даст скачок в развитии на 5 лет вперед.
После появления AGI рынок труда окажется на неизведанной территории.
🟡Дарио Амодей (Anthropic)
Не продавать чипы Китаю — это одно из важнейших действий, чтобы у нас было время справиться с риском выхода ИИ из-под контроля.
ИИ может уничтожить половину начальных позиций для белых воротничков.
🟡Джошуа Бенджио ("Крестный отец ИИ")
Многие люди взаимодействуют с ИИ с ложным убеждением, что они похожи на нас. И чем умнее мы их делаем, тем больше это будет так. Но ИИ не совсем человек.
Неясно, будет ли это хорошо.
Единственное общее мнение - "Мы развиваемся быстрее, чем понимаем, и последствия не будут ждать, пока мы разберемся в ситуации".
@ai_machinelearning_big_data
#news#ai#ml
✔️Anthropic меняет процесс внутреннего найма.
Компании пришлось трижды переписывать тесты для соискателей на позицию performance-инженера, так как их собственные модели решают задачи лучше людей: каждая новая итерация Claude делала предыдущий тест бессмысленным. Изначально кандидаты должны были оптимизировать Python-симулятор вымышленного чипа. Однако выяснилось, что Claude справляется с этим быстрее большинства инженеров.
В итоге компания пошла на радикальный шаг: новый тест больше не имитирует реальные рабочие задачи, а напоминает головоломки со специфическими ограничениями и средой исполнения. Claude пасует перед ними, так как подобные сценарии отсутствуют в его обучающей выборке. Теперь проверить квалификацию инженера можно только на задачах, с которыми ИИ еще не сталкивался.
anthropic.com
✔️Microsoft обязала своих сотрудников использовать Claude Code.
Корпорация начала агрессивное внутреннее внедрение Claude Code от Anthropic в командах, курирующих Windows, Microsoft 365 и Outlook. Использовать инструмент для создания прототипов рекомендуют даже тем сотрудникам, у которых нет профильного опыта в программировании.
Теперь инженеры Microsoft должны работать с Claude Code и GitHub Copilot одновременно, чтобы предоставлять руководству сравнительный анализ двух систем. Ситуация выглядит любопытно: хотя клиентам корпорация продает Copilot как "золотой стандарт ИИ-кодинга", сама она все активнее опирается на решения партнера.
theverge.com
✔️ GitHub открыла доступ к агентным возможностям Copilot через SDK.
Инструмент, вышедший в стадии технического превью, позволяет встраивать агентные возможности GitHub Copilot CLI в собственные приложения. Вместо того чтобы с нуля писать логику планирования задач и оркестрацию вызовов, инженеры теперь могут использовать готовый и проверенный в продакшене цикл исполнения от GitHub.
SDK поддерживает Node.js, Python, Go и .NET. Решение берет на себя всю инфраструктурную часть: аутентификацию, переключение между моделями, стриминг данных и интеграцию с протоколом MCP.
Инструкции по установке, примеры и SDK-референсы для каждого языка выложены в репозитории. Для работы потребуется активная подписка на GitHub Copilot.
github.blog
✔️Adobe расширила ИИ-функции в Acrobat.
Adobe превращает свой PDF-редактор в мультимодальную ИИ-платформу. Теперь он может изменять структуру и содержимое файлов, используя команды на естественном языке. Пользователям стали доступны 12 типов действий через чат: от удаления страниц, комментариев и изображений до массовой замены текста и установки защиты паролем.
Функционал расширился и в сторону генерации: Acrobat умеет создавать черновики презентаций на основе коллекций файлов, автоматически подтягивая данные и оформляя слайды через Adobe Express.
Еще из нового — генерация подкастов на основе PDF и кастомизация ИИ-ассистента: переключение между готовыми ролями либо настройка собственного системного промпта под конкретные задачи.
blog.adobe.com
✔️Google инвестирует в Sakana AI.
Компания объявила о стратегическом партнерстве с японской Sakana AI, основанной выходцами из Google Research Дэвидом Ха и Ллайоном Джонсом. Цель - ускорить внедрение моделей семейства Gemini в Японии. По соглашению, Sakana AI будет использовать технологии Google для собственных R&D-проектов.
Финансовые условия не раскрываются, однако известно, что еще в конце 2025 года оценка стартапа достигла $2,6 млрд., а ранее стартап поддержала NVIDIA.
bloomberg.com
@ai_machinelearning_big_data
#news#ai#ml
📌Т-Sync Conf: как инженеры раскрывают технологии
Бесплатная офлайн-конференция для инженеров от Т-Технологий, где показывают что работает в продуктах и сервисах прямо сейчас.
🟡Как все устроено
🟢Траектории: каждый гость выбирает собственную дорожку — всего восемь технических контуров. AI, Data, R&D, Security, Productivity, UX/UI, Observability и Platform. Каждое направление раскрывает отдельный слой инженерной реальности — можно идти туда, где действительно интересно.
🟢Демо-стенды: тестирование платформ AI и данных, обсуждение инструментальных UX/UI решений, дизайн-токенов и интерфейсов
🟢Инженерные диалоги: откровенные разборы кейсов: как переживать сбои и инциденты, что происходит внутри сервисов, как AI может облегчить жизнь разработчика
🟢Хакатон и публичные сборки: для опытных разработчиков есть хакатон T-Hack Hardcore с призовым фондом, а также сборка сервиса в прямом эфире от Agent Team Activity.
Пройдет все 7 февраля в пространстве TAU. Доступ по предварительной регистрации.
@ai_machinelearning_big_data
#news#ai#ml
✔️Superintelligence Labs передала на внутреннее тестирование первые ИИ-модели.
СТО империи Марка Цукрберга Эндрю Босворт в кулуарах форума в Давосе подтвердил, что Superintelligence Labs достигла первой важной вехи. Подразделение представило рабочие версии моделей для внутреннего использования.
Босворт оценил результаты работы, занявшей менее полугода, как многообещающие, хотя отметил, что впереди еще огромный объем задач по пост-тренировке и полировки моделей до релиза.
Конкретные спецификации не раскрываются, но инсайдеры полагают, что речь идет о текстовой модели под кодовым именем Avocado и мультимодальной Mango, ориентированной на изображения и видео.
reuters.com
✔️Apple разрабатывает носимый ИИ-гаджет в форм-факторе AirTag.
К 2027 году Купертино планирует выпустить конкурента в сегменте носимых ИИ-устройств с стартовым тиражом в 20 млн. единиц. Гаджет описывается как компактный девайс размером с AirTag, который можно крепить на одежду. Инженеры планируют оснастить устройство двумя камерами, тремя микрофонами и магнитной зарядкой, аналогичной Apple Watch.
Проект разрабатывается в авральном режиме: Apple хочет сократить отставание от OpenAI, которая тоже готовит собственные аппаратные решения. Компания рассчитывает использовать для входа в нишу комбинацию из нового железа с обновленной Siri и интеграцию моделей Gemini.
theinformation.com
✔️Google добавила в Gemini тесты SAT.
Google расширила образовательные возможности ИИ-ассистента: теперь с Gemini можно пройти тренировочные тесты SAT, разработанные совместно с The Princeton Review. Инструмент доступен всем и запускается командой «I want to take a practice SAT test» и полностью имитирует структуру реального цифрового экзамена длительностью 2 часа 14 минут.
После завершения теста Gemini не только показывает итоговый балл, но и детально разбирает ошибки, объясняет сложные концепции и составляет персональный план обучения для устранения пробелов в знаниях.
SAT Test получил несколько режимов работы: от строгой симуляции тайминга до обучающего режима с подсказками. В будущем обещают добавить поддержку и других формализованных тестов.
blog.google
✔️Microsoft анонсировала свою первую ИИ-модель для управления роботами.
Rho-alpha - модель на базе архитектуры Phi для контроля двуруких робототехнических систем. Фишкой анонса стал метод VLA+: помимо визуальных данных и текстовых команд, модель обрабатывает тактильные сигналы, что позволяет роботам точнее взаимодействовать с физическими объектами. В будущем планируется добавить и поддержку силовой обратной связи.
Модель понимает команды на естественном языке и поддерживает непрерывное дообучение на основе обратной связи от человека. Сейчас технология тестируется на гуманоидных роботах и открыта в рамках программы раннего доступа.
microsoft.com
✔️Inworld AI релизнула новые модели синтеза речи.
Платформа обновила линейку моделей, выпустив версии TTS-1.5 Max и Mini. Заявлено сочетание высокого качества звучания с экстремально низкой задержкой: для Mini показатель time-to-first-audio составляет менее 130 мс, а для более мощной Max - менее 250 мс. Такие характеристики позволяют использовать их в реальном времени для интерактивных персонажей и голосовых агентов.
В TTS-1.5 снизили количества ошибок в произношении на 40% и улучшили эмоциональную выразительность по сравнению с TTS-1. Ценовая политика выглядит привлекательно: стоимость минуты генерации варьируется от $0.005 до $0.01 - это дешевле чем у конкурентов.
Новые модели поддерживают 15 языков, включая русский (2 женских, 2 мужских), клонирование голоса и доступны через Cloud API и в формате On-Prem решений. На тесты дают 10$ в демо.
inworld.ai
@ai_machinelearning_big_data
#news#ai#ml
✔️Стартап ветеранов индустрии Humans& привлек $480 млн не выпустив ни одного продукта.
Инвесторы продолжают вкладывать деньги в команды с громкими именами, даже если у тех пока нет ничего, кроме планов. Humans&, основанный выходцами из OpenAI, DeepMind и xAI, закрыл раунд финансирования, в результате которого оценка компании достигла $4,48 млрд. В сделке участвовали Nvidia, Джефф Безос и венчурное подразделение Alphabet.
Столь высокий кредит доверия объясняется звездным составом команды. Гендиректор Эрик Зеликман ранее занимался обучением модели Grok-2 в xAI, а сооснователь Жорж Харик был одним из первых сотрудников Google, стоявшим у истоков Gmail и Android. Стартап заявляет, что строит "человекоцентричный ИИ", который будет координировать действия людей, а не просто генерировать текст. Релиз первого продукта обещают уже в начале этого года.
reuters.com
✔️Выходцы из Stability AI опенсорснули real-time модель мира Waypoint-1.
Модель от стартапа Overworld создает интерактивное 3D-окружение прямо в процессе игры: система реагирует на ввод с клавиатуры и мыши, позволяя свободно исследовать генерируемое пространство.
Waypoint-1 построена на видео-диффузионном трансформере на 2,3 млрд. параметров, который обучали на 10 тыс. часах записей геймплея. Для сохранения логической связности мира при длительных сессиях используется метод стабилизации self-forcing via DMD.
Создатели утверждают, что на RTX 5090 Waypoint-1 выдает стабильные 30 FPS. Модель можно скачать на Hugging Face.
over.world
✔️Ollama получила возможность генерации изображений.
Утилита для запуска локальных LLM получила экспериментальную поддержку генерации картинок. На старте пользователям доступны две модели: Z-Image Turbo (6 млрд. параметров) и сверхбыстрая FLUX.2 Klein (4 и 9 млрд.).
Одной из самых удобных функций стала нативная интеграция с терминалами: в Ghostty и iTerm2 можно просматривать результаты генерации прямо в окне консоли. Инструмент позволяет гибко настраивать параметры через командную строку: разрешение, количество шагов и негативные промпты.
В данный момент функционал доступен только на macOS, поддержка Windows и Linux - coming soon.
ollama.com
✔️OpenAI пообещала, что Stargate не взвинтит тарифы для населения.
Компания анонсировала программу «Stargate Community», адресованную жителям регионов, где строятся ее дата-центры. Чтобы избежать перегрузки муниципальных сетей и роста цен на электричество, OpenAI планирует самостоятельно инвестировать в создание новых источников энергии, аккумуляторных станций и модернизацию сетевой инфраструктуры.
Помимо энергетической безопасности, OpenAI также обязалась внедрять технологии защиты водных ресурсов в зонах строительства.
Согласно плану проекта Stargate, к 2029 году компания намерена развернуть мощности на 10 гигаватт. Первый объект уже запущен и используется для обучения моделей, а проектирование следующих площадок ведется в Нью-Мексико, Висконсине и Мичигане.
openai.com
✔️В коде DeepSeek обнаружили следы секретной модели MODEL1 с новой архитектурой.
DeepSeek, похоже, случайно раскрыла карты перед релизом следующего поколения своих моделей. В сети нашли в обновленном репозитории FlashMLA на GitHub множественные упоминания проекта под кодовым именем MODEL1. Ссылки на него встречаются в нескольких файлах параллельно с версией V3.2, что указывает на разработку отдельной, самостоятельной линейки.
Анализ исходников намекает на инженерные изменения: новая модель использует отличные от предшественников подходы к организации KV-кэша, обработке разреженности и оптимизации памяти для FP8-декодирования.
Утечка косвенно подтверждает инсайды о том, что DeepSeek планирует представить новый флагманский продукт уже в середине февраля.
technode.com
@ai_machinelearning_big_data
#news#ai#ml