TGINSIGHT CHAT
Machinelearning
@ai_machinelearning_big_data
ТехнологииПогружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Последние посты
Стр. 45 из 85 · 1,009 постов
💡DeepSeek выложили новый open-source проект — LPLB. Это экспериментальный балансировщик нагрузки для моделей Mixture-of-Experts (MoE). В репозитории описано, как система: • динамически перераспределяет экспертов, опираясь на статистику нагрузки; • создаёт реплики с учётом топологии кластера; • решает оптимальное распределение токенов по экспертам через LP-решатель, работающий прямо на GPU (cuSolverDx + cuBLASDx); • использует метрики загрузки, полученные вручную, через torch.distributed или через буферы Deep-EP. Гайд показывает, как может выглядеть умный и точный балансировщик для больших MoE-архитектур. GitHub: https://github.com/deepseek-ai/LPLB ai_machinelearning_big_data #DeepSeek#LPLB#MoE#AIInfrastructure#OpenSource
⚡️Команда Google Research представила технологию живого перевода речи в речь, которая позволяет говорить на одном языке и почти мгновенно слышать перевод на другом. Раньше процесс проходил через три этапа: распознавание речи, перевод текста и синтез новой речи, из-за чего задержка могла достигать десятков секунд. Исследователи оптимизировали весь конвейер, сделали обработку более устойчивой и сократили время реакции. Перевод звучит естественнее, меньше «подправляется» в реальном времени, а паузы стали значительно короче. Технология приближает момент, когда люди смогут свободно общаться, даже если не знают языка собеседника. https://research.google/blog/real-time-speech-to-speech-translation @ai_machinelearning_big_data #Google#AI#Translation#SpeechToSpeech#GoogleResearch
Опубликован 20 нояб.
На AI Journey робот вызвал Путина на танцевальныйбаттл Сбер показал антропоморфного робота Грина со встроенным ИИ. Разработке доверили самое ценное — танец перед президентом, и он не подвел. ai_machinelearning_big_data
✔️OpenAI выпустила GPT-5.1-Codex-Max. GPT-5.1-Codex-Max - агентная модель для «тяжелой» разработки. Основной упор сделан на длительные процессы: теперь модель эффективнее справляется с многочасовым рефакторингом и сложными агентными циклами внутри IDE. Фишка релиза в технологии «уплотнения», благодаря которой модель удерживает контекст на миллионах токенов без потери связности. По тестам, проведенным OpenAI в SWE-Bench Verified точность выросла до 77,9%, а в SWE-Lancer - почти 80%. Новинка уже стала дефолтной моделью в среде Codex для подписчиков Plus и Pro, а доступ через API разработчики получат в ближайшее время. openai.com ✔️Stack Overflow планирует стать провайдером данных для корпоративного ИИ. На конференции Microsoft Ignite платформа объявила о смене стратегии: теперь это не просто база знаний, а инфраструктурный элемент для корпоративных нейросетей. Обновленный продукт Stack Internal конвертирует внутреннюю экспертизу компаний в формат, доступный ИИ-агентам через MCP. Технически будет добавлен слой метаданных, формирующий рейтинг надежности. Система анализирует автора, актуальность и связность ответа, чтобы агент мог взвесить достоверность информации перед использованием. CEO компании признался, что этот шаг вдохновлен успешными сделками по продаже данных для обучения моделей (по аналогии с Reddit). stackoverflow.blog ✔️Microsoft запустила платформу Agent 365 для управления ИИ-агентами. Agent 365 — инструмент, который позволяет организациям администрировать парк ИИ-агентов как обычных сотрудников. Платформа использует Microsoft Entra для создания единого реестра всех корпоративных ботов, присваивая каждому уникальный ID для строгого разграничения прав доступа и интеграции с корпоративными данными. Помимо безопасности (за которую отвечают Defender и Purview), система предлагает специальные дашборды, которые показывают эффективность работы каждого агента в реальном времени. Agent 365 не замыкается на нативном Copilot Studio, он поддерживает open-source фреймворки и сторонние решения от партнеров MS. Инструмент уже появился в админ-панели Microsoft 365 в рамках программы тестирования. microsoft.com ✔️Manus тестирует расширение для популярных браузеров. Manus запустила бета-тестирование Browser Operator — инструмента, который выводит ИИ-агентов из облачных песочниц в рабочую среду пользователя. Расширение, доступное для Chrome и Edge, позволяет автоматизировать действия в сервисах, требующих сложной авторизации (CRM, закрытые аналитические платформы), используя уже активные локальные сессии. Через коннектор «My Browser» агент получает доступ к нужным вкладкам, а пользователь может в реальном времени наблюдать за его действиями, сохраняя контроль над безопасностью. На данный момент доступ открыт для подписчиков тарифов Pro, Plus и Team. manus.im ✔️xAI построит в Саудовской Аравии дата-центр на 500 МВт. Компания Илона Маска объединилась с саудовской Humain и Nvidia для создания масштабного вычислительного хаба. Проект мощностью 500 мегаватт позволит разместить десятки тысяч GPU для тренировки и инференса следующих поколений моделей Grok. Для xAI это стратегический шаг: собственный хаб за пределами США позволяет снизить зависимость от аренды облачных мощностей у прямых конкурентов. Структура сделки такая: Nvidia поставляет GPU, за саудитами - земля и финансирование, а xAI получает присутствие на Ближнем Востоке. bloomberg.com @ai_machinelearning_big_data #news#ai#ml
📢 Google уверенно выводит свои TPU на новый уровень — и делает это сразу по трём направлениям. Компания развивает три семейства собственных ускорителей: Ironwood, Sunfish и Zebrafish. Так Google закрывает потребности в высокопроизводительном инференсе, обучении моделей и создании огромных суперподов на 2026–2027 годов. TPU уже используют Safe Superintelligence, Salesforce и Midjourney - то есть экосистема растёт. **🚀 Ironwood (TPUv7):* Это самое впечатляющее поколение TPU на сегодня: • примерно 10× быстрее TPU v5 • примерно 4× производительнее TPU v6 • до 4,600 FP8 TFLOPS на чип • 192 GB HBM3e • масштабирование до 9,216 чипов в одном поде • около 1.77 PB общей памяти Такой уровень идеально подходит для LLM, где важны скорость и масштаб. 🔥 Sunfish (предположительно TPUv8) Следующее поколение создаётся совместно с Broadcom. Запуск ожидается ближе к концу 2020-х, и Sunfish должен стать главным ускорителем Google Cloud. 💡 Zebrafish: гибкая и массовая линейка MediaTek выступает ключевым партнером по ASIC. Zebrafish будет: • более доступным по цене • с гибкими характеристиками • подходящим для локальных и более компактных кластеров То есть не только для гигантских суперкомпьютеров, но и для широкого использования. 🌐 Зачем Google три разных TPU? Это даёт компании возможность: • разделять нагрузки между поколениями • удерживать клиентов уровня Anthropic • обеспечивать более 1 ГВт выделенной мощности • конкурировать с Nvidia на уровне не только чипов, но целых систем Google строит собственную вертикаль ИИ-инфраструктуры - масштабную, гибкую и рассчитанную на годы вперёд. Все это нужно, чтобы доминировать на рынке ИИ. @ai_machinelearning_big_data #google#tpu
🌟Reader3: легковесная читалка для книг от Andrej Karpathy Андрей Карпаты опубликовал у себя в Github небольшой проект - утилиту под названием reader3. На первый взгляд, это просто легковесная читалка для электронных книг в формате EPUB, которую можно запустить у себя на компьютере. Но главная идея в том, чтобы читать книги вместе с LLM. Reader3 разбивает книгу по главам, и пользователь может легко скопировать текст текущей главы и вставить его в свой любимый LLM, чтобы обсуждать сюжет, анализировать стиль или задавать вопросы по тексту. Но самое интересное здесь — это философия, которая стоит за проектом. Карпаты пишет, что проект написан "на 90% вайбкодингом", просто для иллюстрации идеи и что он не собирается его поддерживать или улучшать. Я начинаю привыкать читать все (блоги, статьи, главы книг и т. д.) с помощью LLM. Обычно первый проход — ручной, второй — «объяснение/резюме», третий — вопросы и ответы. В результате я обычно получаю более глубокое понимание, чем если бы я просто прошел дальше. Этот процесс становится у меня одним из самых популярных вариантов чтения. А вместо этого предлагает пользователям... просто попросить свою языковую модель изменить код так, как им нравится. Код теперь эфемерный, — пишет Андрей, намекая на то, что эпоха статичных библиотек и долгой поддержки уходит в прошлое. Для тех, кто хочет попробовать, процесс максимально прост. Нужно скачать книгу в формате EPUB и запустить пару команд в терминале, используя uv: uv run reader3.py yourbook.epub # Then run the server: uv run server.py После этого ваша книжная полка станет доступна в браузере по адресу localhost:8123. 📌Лицензирование: MIT License. 🖥GitHub @ai_machinelearning_big_data #AI#ML#LLM#Karpathy#Github#Book
✔️Microsoft, Nvidia и Anthropic заключили сделку на $45 млрд. Компании заключили трехстороннее соглашение, меняющее расклад сил в индустрии. В рамках партнерства Anthropic обязуется закупить вычислительные мощности в Microsoft Azure на $30 млрд. В свою очередь, Nvidia инвестирует в стартап до $10 млрд, а Microsoft вложит еще до $5 млрд. К тому же, это первое сотрудничество Anthropic и Nvidia на уровне моделей: алгоритмы Claude будут оптимизированы под архитектуры Grace Blackwell и будущие Vera Rubin. Еще модели Claude Sonnet 4.5, Opus 4.1 и Haiku 4.5 станут доступны клиентам Microsoft Foundry и будут интегрированы в Copilot (GitHub и Microsoft 365). Сделка делает Claude единственной LLM топ-уровня, представленной на всех трех главных облачных платформах мира. blogs.microsoft.com ✔️Платформа Replicate интегрируется в Cloudflare. Cloudflare объявила о присоединении Replicate, платформы для запуска и деплоя ИИ-моделей. Покупка станет частью единой инфраструктуры «AI Cloud», объединяющей глобальную периферийную сеть Cloudflare с инструментарием Replicate для работы с нейросетями. Для разработчиков это означает крупное обновление сервиса Workers AI. В скором времени каталог из более чем 50 тыс. моделей Replicate станет доступен внутри экосистемы Cloudflare. Фишкой слияния станет поддержка запуска кастомных моделей и дообучения непосредственно на Workers AI. Существующие API Replicate продолжат работать и получат буст производительности за счет инфраструктуры Cloudflare. Также в планах интеграция с другими сервисами: объектным хранилищем R2, векторной базой Vectorize и шлюзом AI Gateway. blog.cloudflare.com ✔️Google Antigravity: среда разработки для управления роем ИИ-агентов. В отличие от Cursor или GitHub Copilot, Antigravity получил режим Manager View. Это центр управления для оркестрации работы множества агентов, выполняющих задачи параллельно в разных воркспейсах. Агенты работают на базе Gemini 3 Pro, Claude Sonnet 4.5 или GPT-OSS и имеют прямой доступ к редактору, терминалу и браузеру. Инструмент умеет запоминать контекст прошлых проектов и обучаться на действиях пользователя. Antigravity уже доступна в публичном превью для macOS, Windows и Linux бесплатно, причём Google обещает «щедрые лимиты» на использование моделей. antigravity.google ✔️NVIDIA представила семейство открытых моделей для физических симуляций и научных расчетов. На конференции SC25 состоялся анонс моделей Apollo, нацеленных на ускорение промышленного инжиниринга. Новое семейство позволит внедрять возможности ИИ в ПО для сложных вычислений в реальном времени — от проектирования микросхем и аэродинамики до прогнозирования климата и задач термоядерного синтеза. В основе Apollo лежит комбинация нейронных операторов, трансформеров и диффузионных методов, адаптированных под законы физики. Инициативу уже поддержали Siemens, Cadence и Synopsys, которые планируют интегрировать новинку в свои продукты. Модели в скором времени появятся на HuggingFace и платформе NVIDIA NIM. blogs.nvidia.com ✔️Ai2 выпустил Deep Research Tulu — открытый аналог OpenAI Deep Research. DR Tulu — открытая модель на 8 млрд. параметров для создания агентов глубокого поиска, которая может самостоятельно планировать исследование, использовать внешние поисковые инструменты, собирать информацию из множества источников и предоставлять ответы с точными ссылками. Модель учили на методе RLER (Reinforcement Learning with Evolving Rubrics). Вместо статических наград методика использует динамические критерии оценки, которые эволюционируют вместе с моделью. Это предотвращает взлом вознаграждения и заставляет агента реально анализировать контекст, а не имитировать правильный формат ответа. По тестам DR Tulu-8B не уступает решениям от OpenAI и Perplexity на задачах long-form research, но работает кардинально дешевле. Стоимость выполнения сложного запроса у нее менее одного цента, тогда как аналогичная задача у OpenAI может стоить $1.80. allenai.org @ai_machinelearning_big_data #news#ai#ml
🔥 Вышла Gemini 3 Pro Контекст: 1M токенов, вывод — 64k, knowledge cut — январь 2025 • Стоимость: $2 / $12 (<200k токенов) и $4 / $18 (>200k токенов) • SOTA-результаты на большинстве бенчмарков • 1501 Elo на LMArena • next-level возможности для vibe coding и сложных кодовых задач • продвинутое мультимодальное понимание (текст, код, картинки и не только) Попробовать можно бесплатно - может понадобиться иностранный IP: https://aistudio.google.com/prompts/new_chat?model=gemini-3-pro-preview @ai_machinelearning_big_data #news#ai#google#Gemini
Опубликован 18 нояб.
Утекли бенчмарки Gemini 3.0 Pro от taker_of_whizz —пока не можем подтвердить подлинность, но цифры просто безумные. Результаты разрывают всё, что мы видели раньше: 🔥HLE: 37,5% 🔥MathArena Apex: 22,3% (для сравнения — **GPT-5.1 всего 1,0%**) Если утечка реальна, Gemini 3.0 Pro именно такой, каким все его и хотели видеть — мощный, продвинутый и с невероятным ростом математических и логических способностей. Ждём официального подтверждения, но выглядит *очень* многообещающе. https://storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-Pro-Model-Card.pdf
🌟Google DeepMind и Google Research представили WeatherNext 2. Новая погодная модель стала быстрее и более детализированной. Она может генерировать прогнозы в 8 раз быстрее, чем предыдущие версии, с разрешением до одного часа. Но самое важное - это способность модели создавать сотни возможных сценариев развития погоды. Вместо одного прогноза система показывает целый спектр вероятностей, включая и наихудшие варианты, что критически важно для планирования в чрезвычайных ситуациях. Каждый такой прогноз генерируется менее чем за минуту на одном TPU-чипе, в то время как традиционным физическим моделям на суперкомпьютере на это потребовались бы часы. В основе WeatherNext 2 лежит метод Functional Generative Network, или FGN. Эта сеть вводит шум прямо в архитектуру модели, что позволяет ей генерировать физически реалистичные и взаимосвязанные прогнозы. Интересно, что модель обучалась только на отдельных, разрозненных элементах погоды, которые метеорологи называют "marginals" - это, например, температура в конкретной точке или скорость ветра на определенной высоте. И на основе этих данных модель самостоятельно учится прогнозировать "joints" — большие, сложные и взаимосвязанные погодные системы. По словам Google, WeatherNext 2 превосходит свою предыдущую версию по 99.9% переменных для прогнозов на срок от 0 до 15 дней. Данные от WeatherNext 2 уже доступны в Earth Engine и BigQuery для исследователей и разработчиков. Кроме того, технология интегрирована в продукты Google: Поиск, Gemini, Pixel Weather и Weather API для Google Maps, а в ближайшие недели появится и в самих Картах Google. @ai_machinelearning_big_data #news#ai#ml
✔️Google подружила Colab с Visual Studio Code. Компания выпустила расширение, которое напрямую связывает редактор кода со средами выполнения Google Colab. Иными словами, теперь можно работать с локальными .ipynb файлами, но выполнять код на Google Colab. Поддерживается подключение как к бесплатным средам выполнения, так и к премиум-тарифам Colab Pro. Для начала работы достаточно установить расширение Google Colab из VS Code Marketplace. При выборе ядра для ноутбука появится опция «Colab», после чего нужно будет авторизоваться в аккаунте Google. Расширение также опубликовано в реестре Open VSX для совместимых редакторов. developers.googleblog.com ✔️ByteDance представила Depth Anything 3. Depth Anything 3 может предсказывает пространственно-согласованную геометрию по одному или нескольким изображениям, даже без известных параметров камеры. Ключевая особенность релиза - в радикальном упрощении архитектуры. Под капотом единый трансформер и унифицированное представление depth-ray. Одна и та же модель теперь решает целый спектр задач: от монокулярной оценки глубины и определения поз камеры до прямой генерации 3D гауссианов для синтеза новых ракурсов. В тестах DA3 превзошла предыдущие версии. Команда выпустила веса моделей, инструментарий CLI и WebUI на Gradio. depth-anything-3.github.io ✔️ Sakana AI стал самым дорогим "единорогом" в Японии. Компания закрыла раунд финансирования на 20 млрд. иен, в результате чего её оценка достигла около $2.635 млрд. Это сделало её самым дорогим непубличным стартапом в истории Японии. Среди инвесторов - Mitsubishi UFJ Financial Group и американские венчурные фонды. Привлечённые средства будут направлены на разработку собственной LLM, адаптированной под особенности японского языка и культуры. Компания уже сотрудничает с MUFG и Daiwa Securities для создания специализированного ИИ для финансового сектора, а в будущем планирует расширяться в оборонную и обрабатывающую промышленность. asia.nikkei.com ✔️Джефф Безос возглавил ИИ-стартап. Основатель Amazon впервые после ухода с поста CEO занял операционную должность, став соруководителем ИИ-стартапа Project Prometheus. Компания привлекла $6.2 млрд, часть из которых — личные средства Безоса, что делает её одним из самых финансируемых стартапов на ранней стадии. Вторым CEO стал Вик Баджадж, физик и химик, ранее работавший в Google X над проектом Waymo. Prometheus сфокусируется на создании ИИ-инструментов для ускорения инженерных и производственных процессов в автомобилестроении, аэрокосмической сфере и вычислительной техники. Стартап нацелен на сегмент ИИ-систем для робототехники, научные исследования и разработку материалов. Несмотря на скрытный режим работы, команда проекта уже насчитывает около 100 специалистов, выходцев из OpenAI и DeepMind и компании Марка Цукербурга. nytimes.com ✔️Сценарий из «Чёрного зеркала» становится реальностью. Актёр Калум Уорти запустил ИИ-платформу 2wai, которая создаёт интерактивные цифровые копии ушедших из жизни людей. Для генерации приложению достаточно нескольких минут видеозаписи с человеком и после их оцифровки, пользователь может взаимодействовать с аватаром своего родственника, симулируя общение на разных этапах жизни. В сети проект вызвал волну негатива и обвинение создателей в эксплуатации горя. Основные претензии сводятся к тому, что технология мешает здоровому процессу скорби и использует образы людей без их согласия. Бета-версия приложения уже доступна в App Store. В будущем разработчики планируют ввести платную подписку и выпустить версию для Android. Calum Worthy в сети Х @ai_machinelearning_big_data #news#ai#ml
Опубликован 17 нояб.
🚀Holo2 - новое поколение мультимодальных моделей, созданных для понимания интерфейсов, навигации и рассуждений в вебе, на десктопах и в мобильных средах. 📈 Результаты Holo2 обновляет рекорды на ключевых бенчмарках UI-grounding: - 66.1% (+3%) на ScreenSpot-Pro - 76.1% (+5%) на OSWorld-G Модель уверенно превосходит все существующие аналоги. 🧠 Архитектура Holo2 построена на Qwen3-VL. Модель показывает сильное понимание интерфейсов и заметно улучшает навигацию и способность рассуждать, в отличие от предыдущих версий. Модель одинаково хорошо запускается в браузере, на Ubuntu и Android. 🔀 Mixture of Experts Флагманская версия 30B-A3B активирует только 3B параметров в каждом шаге - выдавая качество 30B-модели при гораздо меньшей себестоимости вычислений. Модель сама генерирует reasoning-токены - это повышает точность и устойчивость к контексту. Holo2 полностью совместима с архитектурой Surfer 2 и ReAct-пайплайнами - подходит для создания продвинутых UI-агентов. ⚙️ Развёртывание Запускается напрямую через vLLM и любой фреймворк, совместимый с Qwen3-VL. 📜 Лицензии - 4B и 8B — Apache-2 - 30B-A3B — только для некоммерческого использования 🔥Блог: http://hcompany.ai/blog/holo2 🍳Cookbook: https://github.com/hcompai/hai-cookbook/blob/main/holo2/holo_2_localization_huggingface.ipynb 🤗HuggingFace: https://huggingface.co/collections/Hcompany/holo2 @ai_machinelearning_big_data