✔️GPT-5.2-Codex.
OpenAI представила GPT-5.2-Codex, которую называет самым продвинутым инструментом для реальной программной инженерии на сегодняшний день. Модель получила нативную поддержку сжатия контекста, улучшенную интеграцию с терминалом Windows и способность проводить глубокий рефакторинг крупных репозиториев без потери логической нити.
Ключевой апдейт коснулся сферы безопасности - Codex резко прибавил способностей в анализе защищенности кода. Модель уже доступна платным пользователям ChatGPT, а API будет открыт в ближайшие недели.
openai.com
✔️xAI представила Grok Voice Agent API.
Компания Илона Маска открыла публичный доступ к Grok Voice Agent API — нативному интерфейсу speech-to-speech для создания голосовых ассистентов. Решение построено на полностью собственной архитектуре, что позволило достичь задержки ответа менее 1 секунды.
API поддерживает вызов внешних инструментов, веб-поиск, прямую интеграцию с телефонией через SIP и понимает более 100 языков. В бенчмарке Big Bench Audio модель заняла 1 место с точностью 92,3%, опередив Gemini 2.5 Flash и GPT Realtime.
Главной фишкой стала ценовая политика: единый тариф составляет $0.05 за минуту. Это значительно дешевле, чем у OpenAI и ElevenLabs.
x.ai
✔️VS Code получил поддержку стандарта Agent Skills.
В VS Code Insiders появилась поддержка Agent Skills - открытого протокола, разработанного Anthropic. Технология позволяет упаковывать инструкции, скрипты и вспомогательные ресурсы в модули, которыми можно пользоваться в разных ИИ-инструментах.
Главное отличие Agent Skills от привычных кастомных инструкций в функциональности: это не текстовые гайдлайны по стилю кода, а полноценные наборы инструментов для автоматизации задач, которые подгружаются в контекст модели динамически и только при необходимости.
Стандарт дает кросс-платформенность: созданный один раз скилл будет работать одинаково как в интерфейсе редактора, так и в CLI-агентах.
code.visualstudio.com
✔️Google выпустила T5Gemma 2.
T5Gemma 2 получила серьезные архитектурные изменения по сравнению с первой версией. Чтобы снизить потребление памяти, инженеры внедрили tied word embeddings для энкодера и декодера, а также объединили механизмы self-attention и cross-attention в единый слой. Модели доступны в компактных конфигурациях на 270M, 1B и 4B параметров.
Новинка поддерживает контекстное окно до 128 тыс. токенов и умеет обрабатывать не только текст на 140 языках, но и изображения. В бенчмарках T5Gemma 2 обошла базовую Gemma 3 в задачах на длинный контекст, кодинг и мультимодальное понимание. Модели доступны на Hugging Face и Kaggle для исследовательских целей.
blog.google
✔️ИИ-подразделение Марка Цукерберга открыло аудио-визуальный энкодер PE-AV.
Perception Encoder Audiovisual (PE-AV) - техническое ядро, лежащее в основе SAM Audio. Это мультимодальная модель, которая объединяет аудио, видео и текст в единое пространство эмбеддингов.
PE-AV умеет извлекать векторы признаков из аудио или видеокадров и формировать совместные аудиовизуальные представления. Это повышает точность в задачах кросс-модального поиска, детекции звуков и глубокого понимания сцен, где важен синхронный контекст изображения и звука.
В открытом доступе - 6 чекпоинтов модели разного размера (от Small до Large) с вариациями по количеству обрабатываемых кадров. Код опубликован на GitHub, а веса - на Hugging Face.
huggingface.co
@ai_machinelearning_big_data
#news#ai#ml
Polymathic - междисциплинарный ИИ
Ох, какая классная межуниверситетская инициатива - Polymathic🔥.
Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п.
В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков.
На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI.
#AI#ML
Ян Лекун назвал идею AGI иллюзией
Главный научный сотрудник Meta* по искусственному интеллекту Ян Лекун (Yann LeCun) заявил, что понятия общего интеллекта не существует. По его словам, человеческий разум узкоспециализирован и приспособлен только к ограниченному числу задач в физическом мире.
«Мы хорошо ориентируемся в пространстве, умеем общаться, но слабы в шахматах и других сферах. Некоторые животные в чём-то превосходят нас. Мы называем наш интеллект общим только потому, что не осознаём задач, в которых абсолютно беспомощны», — пояснил Лекун. Он добавил, что идея универсального интеллекта — это иллюзия.
AI-исследователь Хантер Эш (Hunter Ash) возразил, что сама способность рассуждать о природе интеллекта уже говорит об универсальности. По его мнению, человек способен играть в любые игры, адаптироваться, анализировать стратегии и видеть причинно-следственные связи. Это и есть проявление общего интеллекта, пусть и в ограниченном виде.
Скептически отреагировал и Илон Маск, сказав, что Лекун «давно выжил из ума».
#news#AI
https://x.com/slow_developer/status/2000959102940291456?s=46&t=pKf_FxsPGBd_YMIWTA8xgg
Опра взяла интервью у Сэма Альтмана и Билла Гейтса. Как эксперты видят AI: скептицизм, оптимизм и опасения насчет безопасности
Опра взяла интервью у экспертов в области искусственного интеллекта в выпуске под названием «AI и наше будущее» (AI and the Future of Us). Основная мысль ее вступительного слова заключалась в том, что AI-джинн уже выпущен из бутылки, и человечеству надо учиться жить в новой реальности.
Позиция Сэма Альтмана:
• AI изучает концепты, которые заложены в обучающих данных;
• правительству необходимо выработать регламент испытаний AI-систем на безопасность, как мы это делаем для самолетов или новых лекарств;
• никто не должен доверять мнению одного человека, который заявляет об исключительной пользе AI.
Позиция Билла Гейтса:
• AI – это как третий человек на приеме у врача: он ведет запись встречи и предлагает рецепт. Вместо того, чтобы врач сидел перед экраном, он общается с вами, а ПО следит за качеством расшифровки;
• AI может принести пользу в образовании: он всегда доступен и понимает, как вас мотивировать, независимо от уровня знаний.
Позиция директора ФБР Кристофера Рэя (Christopher Wray):
• Качество дипфейков повышается очень быстро;
• более трети американских респондентов видели недостоверную информацию – или то, что по их подозрению, было дезинформацией, согласно опросам 2023 года;
• граждане должны проявлять повышенную бдительность, но поводов для паники нет;
• с 2022 по 2023 год число случаев вымогательства с помощью сексуализированного контента увеличилось на 178%, что отчасти обусловлено технологиями искусственного интеллекта. Основной мишенью являются подростки. Злоумышленники отправляют сгенерированные фотографии сексуального характера, просят отправить подобные материалы в ответ, а потом требуют прислать деньги, угрожая в противном случае обнародовать снимки.
#news#AI
https://techcrunch.com/2024/09/12/ophah-just-had-an-ai-special-with-sam-altman-and-bill-gates-here-are-the-highlights/?utm_source=Live+Audience&utm_campaign=6651b82eb2-nature-briefing-ai-robotics-20240917&utm_medium=email&utm_term=0_b27a691814-6651b82eb2-51976144&mc_cid=6651b82eb2&mc_eid=bb37699b5b
🎱Илон Маск о будущем
На международном фестивале рекламы «Каннские львы», который проходил на Лазурном берегу, Илон Маск дал большое интервью о будущем ИИ, Интернета и самого человечества.
📱Хайлайты
➡️О перспективах ИИ. Не нужно быть ни слишком пессимистичными, ни слишком оптимистичными. Отец-основатель искусственного интеллекта Джеффри Хинтон оценивал вероятность уничтожения человечества ИИ в 10-20%. Но я считаю, что наш стакан на 80% полон. Мы живем в самую интересную эпоху за всю историю человечества. Нас ждут весьма значительные изменения уже в следующем году и радикальные перемены — в ближайшие пять лет.
➡️О жизни с суперинтеллектом. Вероятнее всего, развитие ИИ приведет к изобилию. Это не просто всеобщий базовый доход, а всеобщий высокий доход. Работа станет необязательной. Хотя, если ИИ будет делать все лучше нас, это может вызвать экзистенциальный кризис. В лучшем случае развития событий ИИ будет делать все возможное, чтобы сделать нас счастливыми. Если сверхразум пытается сделать нас счастливыми, он, вероятно, преуспеет.
➡️О Neuralink. Долгосрочная цель — симбиоз человека и ИИ. Мы можем восстанавливать подвижность тела после травм позвоночника, передавая сигналы от мозга. Испытания на животных показали очень хорошие результаты.
➡️О будущем Интернета. Поиск в интернете кардинально изменится. Если вместо множества ссылок ИИ будет давать точные ответы, то вы, конечно, предпочтете его Google. Появится новая модель подачи новостей. Это будет агрегация коллективной мудрости десятков миллионов людей — обобщенная информация в реальном времени от экспертов в данной области и людей, которые находятся на месте события.
➡️О роботах-гуманоидах. Человекоподобные роботы будут выполнять различные задачи: выгуливать собак, ухаживать за домом, сидеть с детьми, учить готовить, играть на пианино. Каждый захочет обзавестись таким роботом. Поэтому их будет 20 миллиардов, и люди привяжутся к ним так же, как к роботам R2-D2 and C-3PO из «Звездных войн».
➡️О путешествиик звездам. Мультипланетарная цивилизация имеет гораздо больше шансов на долгосрочное существование. Исследуя Галактику, мы можем найти множество однопланетарных цивилизаций, которые давно вымерли. Расширение нашего сознания поможет нам лучше понять вселенную.
🎁 Сегодня у Илона Маска день рождения — 53 года. Поздравляем!
📱 Интервью здесь.
Больше по теме:
Илон Маск vs Джефф Безос: кто первым будет на Луне?
Большое интервью с Сэмом Альтманом о будущем ИИ
#news@hiaimedia
Технолидеры прогнозируют появления действительного умного AI в горизонте от 2 до 10 лет
Наибольшим оптимистом оказался Илон Маск, который ранее в этом году заявил, что до появления AGI (artificial general intelligence), сопоставимого или превосходящего интеллект человека, остается всего пара лет. Сэм Альтман из OpenAI прогнозирует появление AGI в «ближайшем будущем».
Генеральный директор Baidu Робин Ли, однако, дает более консервативную оценку. Он утверждает, что AGI, превосходящий возможности человека, появится на горизонте свыше 10 лет. «Все шокированы тем, как стремительно развивались технологии AI за последние пару лет. Но для меня это все еще недостаточно быстро. Это слишком медленно», — сетует топ-менеджер. Он отмечает, что гигантские аудитории в миллиарды пользователей продолжают оставаться у «традиционных» сервисов типа YouTube или Tik-Tok, a killer app для AI до сих пор не существует, и в индустрии нет представления о том, каким оно должно быть.
#news#AI
https://www.cnbc.com/2024/05/23/artificial-general-intelligence-more-than-10-years-away-baidu-ceo.html
OpenAI создаёт секретную лабораторию для обучения роботов домашним делам
Компания создала лабораторию в Сан-Франциско, где около 100 операторов-аутсорсеров тренируют роботизированные руки выполнять домашние задачи, например, помещение хлеба в тостер или складывание одежды. Для управления используются 3D-печатные контроллеры GELLO и роботы Franka. Ключевая задача — сбор данных о движении устройств; работа идёт в три смены. OpenAI делает фокус на отборе необходимой информации через удалённое управление. Этот способ считается более дешёвым и легко масштабируемым, чем методы Tesla и Figure — когда данные списываются с человека в костюме с датчиками, предназначенными для управления полноразмерным роботом.
Лаборатория расширилась в четыре раза с февраля 2025 года, и компания планирует открыть вторую в Ричмонде, Калифорния. Ранее OpenAI инвестировала в робототехнические стартапы и сотрудничала с Figure в 2024 г., работа была прекращена в 2025 году. Компания также ищет партнёров в США для разработки потребительских устройств и робототехники, но детали финансирования и сроки не раскрываются. Эксперты, включая Джонатана Эйткена из Университета Шеффилда и Алана Фейна из Университета штата Орегон, отмечают, что эта технология находится на ранней стадии. Ключевой вызов — получение качественных данных для обучения AI, аналогично тому, как это делалось для языковых моделей вроде ChatGPT.
Будущее проекта неясно: неизвестно, как быстро данные от роботизированных рук будут преобразованы в полноценных человекоподобных роботов. Однако подход OpenAI предлагает гибкую и экономичную альтернативу в конкурентной сфере антропоморфной робототехники.
#news#роботы#AI
https://www.ithome.com/0/915/580.htm
OpenAI завершила предобучение модели Spud и создала отдел AGI Deployment для её интеграции в продукты
Компания OpenAI завершила претрейн своей следующей модели AI под кодовым названием Spud (картошка). Согласно внутренним документам, Сэм Альтман сообщил сотрудникам, что в течение нескольких недель у компании появится очень сильная модель, способная "действительно повлиять на экономику".
Вокруг этой модели происходят значительные организационные изменения в стартапе. Альтман перестал лично курировать часть своих прямых подчиненных, включая команды по безопасности, и сосредоточился на привлечении капитала, выстраивании цепочек поставок и строительстве дата-центров.
Продуктовая организация под руководством Фижи Симо (Fidji Simo) была переименована в отдел AGI Deployment. Эта команда будет отвечать за интеграцию следующей модели в продукты компании. Планируется построить на её основе "супер-приложение", объединяющее ChatGPT, Codex и браузер Atlas.
Причины использования термина AGI вместо AI в названии отдела остаются неясными, это может также указывать на подготовку к официальному объявлению достижения AGI. Отказ от проекта SORA App также является частью перестройки и перераспределения вычислительных ресурсов для модели Spud.
#news#AI#OpenAI
https://www.theinformation.com/articles/openai-ceo-shifts-responsibilities-preps-spud-ai-model
В токийском аэропорту Ханэда появились новые грузчики – роботы производства китайской компании Unitree. Андроиды ростом 130 сантиметров перемещают багаж и грузы при обслуживании рейсов компании Japan Airlines. Софтом занимается компания GMO AI and Robotics.
Япония – страна со стареющим населением и острым дефицитом рабочих рук. Цель эксперимента — решить проблему нехватки персонала наземного обслуживания и подготовиться к дальнейшей автоматизации всех процессов.
JDMax#news
В Москве перед 9 мая отрубят всю мобильную связь, ограничат отправку СМС и выключат даже белые списки, пишут СМИ со ссылкой на источники.
Ограничения будут действовать 5, 7 и 9 мая, при этом во всей столице, а не только в центре.
JDMax#news
В Алису AI добавили режим 'Исследовать' — теперь ей можно отдать всё, на что уходит 2 часа поисков и 100 вкладок.
Ищет, сравнивает, пишет цены и дает все ссылки: поможет спланировать майские, выбрать район для переезда или пылесос домой.
JDMax#news
⚡️Оплата по СБП будет ПЛАТНОЙ — с 1 мая комиссии появятся для некоторых переводов.
Если платите бизнесу через QR-код, переводите гонорар самозанятому или компания отправляет деньги физлицу через СБП — операция больше НЕ БУДЕТ полностью бесплатной.
Бесплатными останутся лишь переводы самому себе до 30 млн рублей в месяц, другим людям до 100 тысяч рублей и платежи государству в пользу государства.
JDMax #news
Минпромторг раскрыл размер «технологического сбора». Он составит ₽250 для смартфонов и ₽500 для ноутбуков.
Платить сбор обяжут всех импортеров и производителей за каждую единицу товара. Новые правила начнут действовать уже с 1 сентября 2026-го.
JDMax #news