✔️Microsoft, Nvidia и Anthropic заключили сделку на $45 млрд.
Компании заключили трехстороннее соглашение, меняющее расклад сил в индустрии. В рамках партнерства Anthropic обязуется закупить вычислительные мощности в Microsoft Azure на $30 млрд. В свою очередь, Nvidia инвестирует в стартап до $10 млрд, а Microsoft вложит еще до $5 млрд.
К тому же, это первое сотрудничество Anthropic и Nvidia на уровне моделей: алгоритмы Claude будут оптимизированы под архитектуры Grace Blackwell и будущие Vera Rubin.
Еще модели Claude Sonnet 4.5, Opus 4.1 и Haiku 4.5 станут доступны клиентам Microsoft Foundry и будут интегрированы в Copilot (GitHub и Microsoft 365). Сделка делает Claude единственной LLM топ-уровня, представленной на всех трех главных облачных платформах мира.
blogs.microsoft.com
✔️Платформа Replicate интегрируется в Cloudflare.
Cloudflare объявила о присоединении Replicate, платформы для запуска и деплоя ИИ-моделей. Покупка станет частью единой инфраструктуры «AI Cloud», объединяющей глобальную периферийную сеть Cloudflare с инструментарием Replicate для работы с нейросетями.
Для разработчиков это означает крупное обновление сервиса Workers AI. В скором времени каталог из более чем 50 тыс. моделей Replicate станет доступен внутри экосистемы Cloudflare. Фишкой слияния станет поддержка запуска кастомных моделей и дообучения непосредственно на Workers AI.
Существующие API Replicate продолжат работать и получат буст производительности за счет инфраструктуры Cloudflare. Также в планах интеграция с другими сервисами: объектным хранилищем R2, векторной базой Vectorize и шлюзом AI Gateway.
blog.cloudflare.com
✔️Google Antigravity: среда разработки для управления роем ИИ-агентов.
В отличие от Cursor или GitHub Copilot, Antigravity получил режим Manager View. Это центр управления для оркестрации работы множества агентов, выполняющих задачи параллельно в разных воркспейсах.
Агенты работают на базе Gemini 3 Pro, Claude Sonnet 4.5 или GPT-OSS и имеют прямой доступ к редактору, терминалу и браузеру. Инструмент умеет запоминать контекст прошлых проектов и обучаться на действиях пользователя.
Antigravity уже доступна в публичном превью для macOS, Windows и Linux бесплатно, причём Google обещает «щедрые лимиты» на использование моделей.
antigravity.google
✔️NVIDIA представила семейство открытых моделей для физических симуляций и научных расчетов.
На конференции SC25 состоялся анонс моделей Apollo, нацеленных на ускорение промышленного инжиниринга. Новое семейство позволит внедрять возможности ИИ в ПО для сложных вычислений в реальном времени — от проектирования микросхем и аэродинамики до прогнозирования климата и задач термоядерного синтеза.
В основе Apollo лежит комбинация нейронных операторов, трансформеров и диффузионных методов, адаптированных под законы физики. Инициативу уже поддержали Siemens, Cadence и Synopsys, которые планируют интегрировать новинку в свои продукты. Модели в скором времени появятся на HuggingFace и платформе NVIDIA NIM.
blogs.nvidia.com
✔️Ai2 выпустил Deep Research Tulu — открытый аналог OpenAI Deep Research.
DR Tulu — открытая модель на 8 млрд. параметров для создания агентов глубокого поиска, которая может самостоятельно планировать исследование, использовать внешние поисковые инструменты, собирать информацию из множества источников и предоставлять ответы с точными ссылками.
Модель учили на методе RLER (Reinforcement Learning with Evolving Rubrics). Вместо статических наград методика использует динамические критерии оценки, которые эволюционируют вместе с моделью. Это предотвращает взлом вознаграждения и заставляет агента реально анализировать контекст, а не имитировать правильный формат ответа.
По тестам DR Tulu-8B не уступает решениям от OpenAI и Perplexity на задачах long-form research, но работает кардинально дешевле. Стоимость выполнения сложного запроса у нее менее одного цента, тогда как аналогичная задача у OpenAI может стоить $1.80.
allenai.org
@ai_machinelearning_big_data
#news#ai#ml
🌟Google DeepMind и Google Research представили WeatherNext 2.
Новая погодная модель стала быстрее и более детализированной. Она может генерировать прогнозы в 8 раз быстрее, чем предыдущие версии, с разрешением до одного часа.
Но самое важное - это способность модели создавать сотни возможных сценариев развития погоды. Вместо одного прогноза система показывает целый спектр вероятностей, включая и наихудшие варианты, что критически важно для планирования в чрезвычайных ситуациях.
Каждый такой прогноз генерируется менее чем за минуту на одном TPU-чипе, в то время как традиционным физическим моделям на суперкомпьютере на это потребовались бы часы.
В основе WeatherNext 2 лежит метод Functional Generative Network, или FGN. Эта сеть вводит шум прямо в архитектуру модели, что позволяет ей генерировать физически реалистичные и взаимосвязанные прогнозы.
Интересно, что модель обучалась только на отдельных, разрозненных элементах погоды, которые метеорологи называют "marginals" - это, например, температура в конкретной точке или скорость ветра на определенной высоте.
И на основе этих данных модель самостоятельно учится прогнозировать "joints" — большие, сложные и взаимосвязанные погодные системы. По словам Google, WeatherNext 2 превосходит свою предыдущую версию по 99.9% переменных для прогнозов на срок от 0 до 15 дней.
Данные от WeatherNext 2 уже доступны в Earth Engine и BigQuery для исследователей и разработчиков. Кроме того, технология интегрирована в продукты Google: Поиск, Gemini, Pixel Weather и Weather API для Google Maps, а в ближайшие недели появится и в самих Картах Google.
@ai_machinelearning_big_data
#news#ai#ml
✔️Google подружила Colab с Visual Studio Code.
Компания выпустила расширение, которое напрямую связывает редактор кода со средами выполнения Google Colab. Иными словами, теперь можно работать с локальными .ipynb файлами, но выполнять код на Google Colab. Поддерживается подключение как к бесплатным средам выполнения, так и к премиум-тарифам Colab Pro.
Для начала работы достаточно установить расширение Google Colab из VS Code Marketplace. При выборе ядра для ноутбука появится опция «Colab», после чего нужно будет авторизоваться в аккаунте Google. Расширение также опубликовано в реестре Open VSX для совместимых редакторов.
developers.googleblog.com
✔️ByteDance представила Depth Anything 3.
Depth Anything 3 может предсказывает пространственно-согласованную геометрию по одному или нескольким изображениям, даже без известных параметров камеры. Ключевая особенность релиза - в радикальном упрощении архитектуры.
Под капотом единый трансформер и унифицированное представление depth-ray. Одна и та же модель теперь решает целый спектр задач: от монокулярной оценки глубины и определения поз камеры до прямой генерации 3D гауссианов для синтеза новых ракурсов.
В тестах DA3 превзошла предыдущие версии. Команда выпустила веса моделей, инструментарий CLI и WebUI на Gradio.
depth-anything-3.github.io
✔️ Sakana AI стал самым дорогим "единорогом" в Японии.
Компания закрыла раунд финансирования на 20 млрд. иен, в результате чего её оценка достигла около $2.635 млрд. Это сделало её самым дорогим непубличным стартапом в истории Японии. Среди инвесторов - Mitsubishi UFJ Financial Group и американские венчурные фонды.
Привлечённые средства будут направлены на разработку собственной LLM, адаптированной под особенности японского языка и культуры. Компания уже сотрудничает с MUFG и Daiwa Securities для создания специализированного ИИ для финансового сектора, а в будущем планирует расширяться в оборонную и обрабатывающую промышленность.
asia.nikkei.com
✔️Джефф Безос возглавил ИИ-стартап.
Основатель Amazon впервые после ухода с поста CEO занял операционную должность, став соруководителем ИИ-стартапа Project Prometheus. Компания привлекла $6.2 млрд, часть из которых — личные средства Безоса, что делает её одним из самых финансируемых стартапов на ранней стадии. Вторым CEO стал Вик Баджадж, физик и химик, ранее работавший в Google X над проектом Waymo.
Prometheus сфокусируется на создании ИИ-инструментов для ускорения инженерных и производственных процессов в автомобилестроении, аэрокосмической сфере и вычислительной техники. Стартап нацелен на сегмент ИИ-систем для робототехники, научные исследования и разработку материалов.
Несмотря на скрытный режим работы, команда проекта уже насчитывает около 100 специалистов, выходцев из OpenAI и DeepMind и компании Марка Цукербурга.
nytimes.com
✔️Сценарий из «Чёрного зеркала» становится реальностью.
Актёр Калум Уорти запустил ИИ-платформу 2wai, которая создаёт интерактивные цифровые копии ушедших из жизни людей. Для генерации приложению достаточно нескольких минут видеозаписи с человеком и после их оцифровки, пользователь может взаимодействовать с аватаром своего родственника, симулируя общение на разных этапах жизни.
В сети проект вызвал волну негатива и обвинение создателей в эксплуатации горя. Основные претензии сводятся к тому, что технология мешает здоровому процессу скорби и использует образы людей без их согласия.
Бета-версия приложения уже доступна в App Store. В будущем разработчики планируют ввести платную подписку и выпустить версию для Android.
Calum Worthy в сети Х
@ai_machinelearning_big_data
#news#ai#ml
📌В октябре США пережили самую масштабную волну увольнений за 22 года.
Согласно свежему отчету от Challenger о состоянии рынка труда в США на октябрь 2025 года, американские компании объявили о сокращениях 153 тыс. рабочих мест. Это на 175% больше, чем в октябре прошлого года, и на 183% больше, чем в предыдущем месяце.
Фактически, это самый высокий показатель для октября с 2003 года. С начала 2025 года общее число сокращений уже превысило 1 миллион.
Challenger, Gray & Christmas — это авторитетная американская компания в области карьерного консалтинга. Компания работает с 1966 года, имеет офисы по по всей Северной Америке и регулярно публикует отчёты о сокращениях и текучести кадров, которые цитируются ведущими СМИ.
На рынок труда влияют несколько факторов: коррекция пост-ковидного бума в найме, замедление потребительских и корпоративных расходов, и, что важно, внедрение ИИ.
Только за октябрь месяц ИИ был назван прямой причиной сокращения 31 тысячи рабочих мест. А с начала года эта цифра составляет больше 48 тысяч.
В то же время, сам технологический сектор, родитель ИИ, тоже находится под сильным давлением.
В октябре технологические компании объявили о 33 тысячах увольнений. За весь год сокращения в секторе выросли на 17% по сравнению с аналогичным периодом 2024 года.
Однако, отраслью, которая сократила больше всего рабочих мест в октябре, стала складская логистика (47 тыс. рабочих мест). Challenger связывает это с бумом автоматизации.
И пока сокращения растут, картина с наймом новых сотрудников выглядит не лучше.
Планы по найму в этом году упали на 35% по сравнению с прошлым годом, достигнув самого низкого уровня с 2011 года.
Даже сезонный найм находится на самой низкой отметке с тех пор, как Challenger начали отслеживать эти данные в 2012 году.
@ai_machinelearning_big_data
#news#ai#ml
🙂AGI стал ближе как никогда.
Пришло время по-настоящему значимых прорывов.
Небольшая, но приятная победа:
Если в пользовательских инструкциях указать ChatGPT не использовать тире, он наконец-то делает то, что должен!
@ai_machinelearning_big_data
#news#ai#ml
✔️OpenAI открыла доступ к GPT-5.1 через API.
В этом режиме появилась динамическая адаптация: для простых задач она использует меньше времени на размышление, а для сложных запросов модель сохраняет способность к глубокому анализу. Также появился режим «без рассуждений».
Для разработчиков появилось 2 новых инструмента. Apply_patch - редактирование кода с помощью патчей и shell - выполнение команд в локальной среде. Ещё добавили расширенное кеширование промптов (до 24 часов), что ускоряет ответы на последующие запросы в рамках одной сессии. Модель уже доступна для всех платных тарифов.
openai.com
✔️LangChain представил песочницы для безопасного запуска ИИ-агентов.
Sandboxes for DeepAgents - набор интеграций для безопасного выполнения кода, сгенерированного ИИ-агентами в изолированных удаленных окружениях от партнеров проекта: Runloop, Daytona и Modal.
Новая функция защищает локальную машину от вредоносных действий агента и позволяет создавать чистые окружения с нужными зависимостями под конкретную задачу, не загрязняя основную систему. Это упрощает параллельный запуск нескольких агентов и выполнение длительных операций.
blog.langchain.com
✔️Photoroom выпустила text-to-image модель PRX.
Это второе поколение модели Photoroom и, что важно, оно полностью открытое. В релиз вошли базовая, SFT и дистиллированная версии модели. PRX генерирует изображения в 256 и 512 пикселей, но разработчики также выложили предварительную версию для 1024 пикселей.
PRX получила 1.3 млрд. параметров и была обучена менее чем за 10 дней на 32-х H200. Под капотом - упрощенная архитектура MMDiT, Flux VAE и T5-Gemma в качестве энкодера текста. Попробовать демо-версию можно на Hugging Face Spaces. Семейство моделей доступно на Hugging Face под лицензией Apache 2.0.
CEO Photoroom в сети X
✔️Firefox анонсировал AI Window.
AI Window - новая функция для браузера, которая позволяет взаимодействовать с ИИ-ассистентом во время просмотра веб-страниц. Главный акцент разработчики делают на пользовательском контроле и приватности.
В отличие от конкурентов, которые жестко интегрируют ИИ в свои продукты, Firefox предлагает полностью опциональный подход. Пользователь сам решает, когда ему нужна помощь ассистента, и может в любой момент отключить эту функцию, вернувшись к классическому режиму.
Сейчас Firefox собирает заявки от желающих попробовать AI Window, записаться в лист ожидания можно тут.
blog.mozilla.org
✔️NotebookLM получил крупное обновление.
Главная новинка - функция Deep Research, это своего рода ИИ-агент, который автоматизирует процесс онлайн-исследований. Пользователь задает вопрос, после чего система составляет план поиска, анализирует найденные в Интернете материалы и генерирует структурированный отчет с указанием всех источников. Этот отчет и его исходники можно сразу добавить в рабочее пространство для дальнейшего анализа.
Также была расширена поддержка форматов файлов. Теперь NotebookLM может анализировать данные из Google Sheets и документов Microsoft Word. Еще добавлена возможность загружать изображения и добавлять файлы из Google Drive по ссылке.
Все новые функции станут доступны в течение следующей недели, а поддержка изображений появится позже.
blog.google
@ai_machinelearning_big_data
#news#ai#ml
✔️Эффективность локального ИИ выросла в 5.3 раза за два года.
Группа Hazy Research провела исследование, доказывающее рост жизнеспособности локального ИИ-инференса. Для оценки взяли унифицированный показатель «интеллект на ватт» (intelligence per watt, IPW) - это соотношение точности выполнения задачи к потребляемой мощности.
Результаты показали, что локальные LLM до 20 млрд. параметров уже способны обрабатывать 88.7% типичных одноэтапных запросов в чатах и задачах на логику. Общая эффективность локального ИИ показала рост в 5.3 раза за период с 2023 по 2025 год. Этот скачок обусловлен как улучшением самих моделей (в 3.1 раза), так и развитием аппаратных ускорителей (в 1.7 раза).
stanford.edu
✔️LeJEPA: self-supervised learning без сложных эвристик.
Ян Лекун предложил простой метод ля self-supervised обучения - LeJEPA. Традиционные подходы требовали сложных трюков чтобы избежать коллапса признаков: stop-gradient и сетей учитель-студент. LeJEPA отказывается от этих эвристик в пользу одного регуляризатора, SIGReg (Sketched Isotropic Gaussian Regularization).
Задача SIGReg - заставить векторы признаков равномерно распределяться в пространстве, формируя изотропное сферическое облако. В своей работе, Ян доказывает, что такая форма математически оптимальна для минимизации ошибок на будущих задачах.
На практике это делает обучение более стабильным, упрощает его масштабирование и оценку качества модели. Тестовая модель на 1.8 млрд. параметров и показала 79% точности на ImageNet-1K. Код LeJEPA доступен на GitHub.
arxiv.org
✔️Lumine от ByteDance: ИИ-агент, способный часами проходить 3D-игры.
ByteDance разработал ИИ-агента, который может самостоятельно выполнять многочасовые миссии в сложных открытых 3D-мирах, например в Genshin Impact, Honkai: Star Rail и Wuthering Waves. В отличие от своих конкурентов, Lumine обрабатывает видеопоток с экрана и генерирует команды для клавиатуры и мыши в реальном времени.
Агент построен на базе Qwen2-VL-7B и обучен на 1700 часах человеческого геймплея. Сначала он осваивал базовые действия, а затем учился следовать инструкциям и, наконец, развил способность к адаптивному мышлению на небольшом ризонинг-датасете.
В тестах Lumine показал способности сражаться с боссами, используя тактику, решать головоломки и взаимодействовать с NPC. Что важно, агент может переносить навыки, справляясь с задачами в незнакомых локациях и в совершенно новых играх без дополнительного обучения.
lumine-ai.org
✔️IBM представила квантовые процессоры Nighthawk и Loon.
IBM анонсировала 2 новых квантовых процессора и объявила о переносе всего производства на 300-мм пластины на мощностях Albany NanoTech. Этот переход позволяет снизить стоимость чипов и, по заявлению компании, уже удвоил скорость НИОКР.
Nighthawk на 30% увеличивает сложность схем при прежнем уровне ошибок и ориентирован на задачи с 5000 двухкубитных гейтов. Он станет доступен пользователям IBM к концу 2025 года. Чип Loon, в свою очередь, сфокусирован на отказоустойчивости, он использует эффективные коды коррекции ошибок (qLDPC), реализованные на год раньше, чем планировалось.
Опираясь на эти инновации, IBM подтвердила свои планы по достижению квантового превосходства к 2026 году и созданию полноценной отказоустойчивой системы к 2029.
ibm.com
✔️Chad IDE: среда разработки со встроенными TikTok и Tinder.
Стартап Clad Labs, выпустился из Y Combinator с продуктом «Chad: The Brainrot IDE». Это среда разработки со встроенными развлечениями. Идея в том, что пока разработчик ждет завершения задачи от ИИ-ассистента, он может полистать TikTok, Tinder или поиграть в мини-игры прямо в окне IDE.
По мнению основателей, это решает проблему «переключения контекста». Вместо того чтобы брать в руки телефон и полностью выпадать из рабочего процесса, разработчик остается в среде разработки и может мгновенно вернуться к коду, как только ИИ закончит свою работу.
Сейчас Chad IDE находится в стадии закрытого бета-тестирования, доступ можно получить только по приглашению.
techcrunch.com
@ai_machinelearning_big_data
#news#ai#ml
🌟World Labs открыла публичный доступ к Marble.
Стартап сделал общедоступной свою генеративную мультимодальную «модель мира» Marble, анонсированную 2 месяца назад.
На платформе, где развернута модель, можно создавать детализированные 3D-сцены из текста, одного или нескольких изображений, коротких видео и простых 3D-макетов.
Фишкой сервиса стал инструмент Chisel, который позволяет «лепить» миры, отделяя структуру от стиля. Пользователь может задать геометрию сцены с помощью примитивных 3D-фигур, а ее визуальное наполнение и стилистику описать текстовым промптом.
Marble поддерживает интерактивное редактирование, бесшовное расширение уже сгенерированных пространств и создание композиции из нескольких миров.
Готовые сцены можно экспортировать в форматы Gaussian splats, полигональные сетки или видео.
@ai_machinelearning_big_data
#news#ai#ml
⚡️Baidu релизнула ERNIE 5.0.
Китайский техгигант выпустил новую версию своей флагманской языковой модели Ernie 5.0 на 2.4 трлн. параметров.
Модель омнимодальна, т.е может работать с текстом, изображениями, аудио и видео как на входе, так и на выходе.
В ERNIE 5.0 улучшили понимание инструкций, креативное письмо и она показывает сильные результаты в задачах, требующих логики, запоминания и убедительности.
Пока кроме этих общих формулировок и трудночитаемых картинок с бенчмарками подробной информации нет, но модель можно потестить в чат-боте.
@ai_machinelearning_big_data
#news#ai#ml
✔️Microsoft представила Visual Studio 2026.
По словам Microsoft - это первая в мире «интеллектуальная IDE», она запускается быстрее и на 50% реже зависает, а ее ИИ-инструменты, включая новых агентов для C# и C++, теперь помогают не только в написании кода, но и в отладке, профилировании и модернизации приложений. Новая версия получила полную совместимость с проектами и расширениями от VS 2022.
Кроме того, среда разработки была отделена от инструментов сборки, так что теперь можно обновлять саму IDE, не затрагивая компиляторы .NET и C++. Visual Studio 2026 уже доступна для подписчиков, а автономная лицензия поступит в продажу с 1 декабря 2025 года. Полный список изменений - в Release Notes.
devblogs.microsoft.com
✔️Google объединит мощь Gemini с приватностью локальных вычислений.
Google анонсировала новую платформу Private AI Compute, которая позволяет использовать Gemini в облаке, обеспечивая при этом уровень приватности, сопоставимый с обработкой на устройстве. В основе лежит изолированное защищенное окружение на базе собственного технологического стека Google, а данные обрабатываются в специальном зашифрованном пространстве, доступ к которому имеет только пользователь.
Google обещает, что даже сотрудники компании не смогут получить доступ к информации. Первыми возможностями на базе этой платформы станет учучшатель промптов Magic Cue на Pixel 10 и обобщение транскрипций в приложении Recorder.
blog.google
✔️LAION запустили Project AELLA для ИИ-структуризации научных статей.
LAION, совместно с Inference.net и Wyndlabs AI, представили открытую инициативу Project AELLA для демократизации доступа к научным знаниям. В рамках проекта было обработано около 100 млн. академических публикаций, для которых с помощью LLM создаются структурированные аннотации.
Проект должен значительно ускорить поиск информации, улучшить машинный анализ и повысить доступность научного контента. Специально для этой задачи были дообучены 2 языковые модели. По заявлению LAION, в целевых тестах они показывают производительность, сравнимую с GPT-5 и Claude 4.5.
На старте проект предлагает датасет из 100 тыс. готовых аннотаций, дообученные модели и 3D-визуализатор для навигации по научным областям. Все материалы открыты для исследователей и разработчиков.
laion.ai
✔️Стартап Olares анонсировал персональное ИИ-облако с RTX 5090 Mobile.
Стартап Olares показал свой дебютный продукт - Olares One. Это персональное ИИ-облако, спроектированное для локального запуска моделей. Устройство выполнено в формате компактного десктопа, оснащено видеокартой NVIDIA GeForce RTX 5090 Mobile с 24 ГБ памяти GDDR7, процессором Intel Core Ultra 9 275HX и 96 ГБ оперативной памяти.
Работать Olares One будет под управлением собственной открытой Olares OS. Предзаказы стартуют на Kickstarter в декабре, а полноценная презентация состоится на выставке CES в январе 2026 года. Проект уже привлек $45 млн. инвестиций.
techpowerup.com
✔️Создан протокол шифрованной самопроверки на уровне чипа для квантового компьютера.
Международная команда исследователей успешно протестировала криптографически защищенный протокол верификации, который позволяет квантовому компьютеру самостоятельно проверять корректность собственных результатов. Технология была развернута на квантовом процессоре H1-1 от Quantinuum и показала свою эффективность на задаче с 52 кубитами.
Идея заключается в интеграции проверочных тестов непосредственно в процесс вычислений на одном чипе. Протокол случайным образом чередует вычислительные раунды с тестовыми ловушками. Анализируя результаты тестов, система статистически определяет, можно ли доверять итоговому результату вычислений.
phys.org
@ai_machinelearning_big_data
#news#ai#ml
⚡️ChatGPT-5.1
OpenAI выпустила GPT-5.1, сделав основной упор на интеллект и качество диалога.
🟢GPT-5.1 Instant - модель с функцией адаптивного мышления. Она способна самостоятельно «задумываться» над сложными задачами, что позволило выбивать более высокие баллы по математическим задачам AIME 2025 и задачам по программированию Codeforces. Модель стала лучше следовать инструкциям и получила более «теплый» стиль общения по умолчанию.
🟢GPT-5.1 Thinking тоже была улучшена: она быстрее справляется с простыми запросами и выдает более четкие ответы с меньшим количеством жаргона.
Вместе с моделями OpenAI расширила возможности кастомизации тона ответов, добавив новые стили: «Профессиональный», «Откровенный» и «Необычный».
Обновление уже раскатывают на платных подписчиков, а доступ через API появится в ближайшие дни. Предыдущие версии GPT-5 останутся доступны в течение трех месяцев.
@ai_machinelearning_big_data
#news#ai#ml
✔️ElevenLabs Scribe v2 Realtime: STT-модель с задержкой менее 150 мс.
ElevenLabs представила Scribe v2 Realtime, новую модель Speech-to-Text, разработанную для задач, требующих минимальной задержки: голосовых агентов, ассистентов для совещаний и создания субтитров в реальном времени. Система обрабатывает речь с задержкой менее 150 мс, поддерживает более 90 языков и демонстрирует точность 93.5% по 30 популярным языкам. Особое внимание уделено работе с аудиозаписями, содержащими фоновый шум.
Фишкой модели стала «отрицательная задержка» - функция предсказывания следующего слова и знака препинания. Также есть автоматическое определение языка, обнаружение голоса и полный контроль над фиксацией сегментов транскрипции. Сервис готов к корпоративному использованию (SOC 2, GDPR) и уже доступен через API.
elevenlabs.io
✔️Backboard установила рекорд в тесте долговременной памяти для ИИ.
Платформа для ИИ-агентов Backboard достигла рекордного показателя в 90.1% в бенчмарке LoCoMo, предназначенном для оценки долговременной диалоговой памяти. Это лучше предыдущих показателей популярных библиотек, которые находились в диапазоне 67–69%.
LoCoMo тестирует способность системы запоминать, обновлять и извлекать факты о пользователе и контекст диалога на протяжении многих сессий. Высокий балл означает, что ассистенты будут лучше следовать инструкциям, реже переспрашивать и требовать более коротких промптов, что снижает расход токенов.
Backboard предоставляет API для долгосрочной памяти, мультимодельный API для роутинга между 2200+ LLM и RAG-слой. Все результаты теста воспроизводимы - скрипты, логи и промпты опубликованы на GitHub.
backboard.io
✔️Две трети топовых ИИ-компаний допустили утечку секретов на GitHub.
Компания по облачной безопасности Wiz обнаружила, что 65% компаний из списка Forbes AI 50 допустили утечку API-ключей, токенов и других учетных данных на GitHub. По словам исследователей, это могло привести к раскрытию приватных моделей, данных обучения или внутренней структуры организаций.
Чаще всего секреты находили в файлах Jupyter Notebook и Python-скриптах. Среди утечек были токены Hugging Face, Azure и W&B. В одном из случаев скомпрометированный токен Hugging Face мог открыть доступ к тысяче приватных моделей.
Wiz публично назвала только ElevenLabs и LangChain, отметив их быструю реакцию. При этом почти половина всех уведомлений об утечках, отправленных другим компаниям, осталась без ответа.
wiz.io
✔️Cloudflare запустила поддержку Python в сервисе Workflows.
Cloudflare объявила о поддержке Python в своем сервисе Workflows, предназначенном для создания и управления многоэтапными процессами на платформе Workers. Раньше инструмент был доступен только для TypeScript.
Новшество открывает сервис для сообщества Python-разработчиков, специализирующихся на AI/ML и обработке данных. В качестве примеров использования компания приводит оркестрацию конвейеров данных, обучение ML-моделей и создание сложных ИИ-агентов, архитектура которых упрощается за счет встроенной обработке ошибок и сохранению состояния. Технически часть реализована через Pyodide — порт CPython в WebAssembly.
blog.cloudflare.com
✔️OpenAI тратит на Sora около 15 млн. долларов в день.
По оценкам аналитиков, затраты на видеогенератор Sora обходятся OpenAI в $15 млн. в день, что в годовом выражении превышает $5 млрд. Расчеты основаны на стоимости генерации одного 10-секундного ролика, которая составляет для компании около $1.3, и предполагаемом объеме в 11 млн. видео ежедневно. Несмотря на убыточность, OpenAI, вероятно, следует классической стратегии захвата рынка, стремясь сначала сформировать аудиторию, а уже потом искать пути монетизации. Бесплатный доступ также насыщает компанию огромным количеством данных для дальнейшего обучения моделей.
Впрочем, Сэм Альтман уже подтвердил, что компания планирует сокращать объемы бесплатной генерации. По его словам, ни одна рекламная модель не сможет покрыть расходы на создание «забавных мемов для трех друзей».
forbes.com
@ai_machinelearning_big_data
#news#ai#ml