TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #9660 · 12 мар.

🌟Nemotron-Terminal: небольшое семейство для терминальных задач. NVIDIA обучила семейство моделей Nemotron-Terminal для автономной работы в терминале Linux: устанавливать зависимости, писать и запускать код, отлаживать окружения и выполнять сквозные инженерные задачи без участия человека. Семейство построено на базе Qwen3 и специально собранном датасете Terminal-Corpus. И фишка не в архитектуре, а в данных. 🟡NVIDIA собрала пайплайн Terminal-Task-Gen с 2 потоками. Первый адаптирует готовые датасеты по математике, коду и SWE-задачам под терминальный формат (без участия LLM в процессе адаптации). Второй генерирует синтетику 2 методами: seed-based (LLM создает новые задачи на основе существующих задач из смежных областей) и skill-based (LLM комбинирует до пяти примитивных навыков из таксономии по 9 доменам: Security, Data Science, System Administration и другим). 🟡В открытый релиз вошли все три модели на 8B, 14B, 32B параметров и 2 датасета: Terminal-Corpus: около 366K траекторий выполнения задач, разбитых на два потока: ~226K адаптированных примеров из Math/Code/SWE и ~140K синтетических задач на основе skill-таксономии. Synthetic-Tasks: задачи в стандартизированном формате: инструкция, Docker-окружение из 9 преднастроенных образов и верификационный набор на pytest. 🟡Результаты прогонов на бенчах. На Terminal-Bench 2.0 все 3 модели показали кратный рост относительно базовой Qwen3: 8B - с 2.5% до 13%, 14B - с 4% до 20.2%, 32B - с 3.4% до 27.4%. Для сравнения: Qwen3-Coder на 480B параметров набирает 23.9%, GPT-5-Mini - 24.0%, Grok 4 - 23.1%. Nemotron-Terminal-32B превосходит или вплотную конкурирует с ними всеми при разнице в размере на порядок. 🟡Несколько внезапных выводов из абляции. Фильтрация неудачных траекторий вредит. Модель, обученная на всех траекториях включая ошибочные, набирает 12.4% против 5.06% у варианта только с успешными. Curriculum learning (сначала простые данные, потом сложные) не дал преимуществ перед простым смешанным обучением. Увеличение контекстного окна с 32K до 65K токенов также не помогло, длинные траектории оказались шумнее. 📌Лицензирование моделей: NVIDIA Open Model License 📌Лицензирование датасетов : CC-BY-4.0 License. 🟡Набор моделей 🟡Arxiv @ai_machinelearning_big_data #AI#ML#LLM#NemotronTerminal#NVIDIA

Результаты

Найдено 10 похожих постов

Earth&Climate Tech

@earth_climate_tech · Post #401 · 19.10.2023, 16:00

​​Polymathic - междисциплинарный ИИ Ох, какая классная межуниверситетская инициатива - Polymathic🔥. Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п. В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков. На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI. #AI#ML

Hashtags

⚙️Nvidia на мероприятии GTC 2023представила набор облачных сервисов AI Foundations для разработки искусственного интеллекта. По данным техгиганта, с его помощью компании смогут создавать, совершенствовать и использовать крупноязыковые и генеративные ИИ-алгоритмы, обучая их на собственных данных, для решения уникальных задач. 🪄 В AI Foundations входят языковой сервис NeMo и платформа Picasso для генерации изображений, видео и 3D. Оба продукта включают предварительно обученные модели, API-интерфейсы, оптимизированные механизмы логического вывода, фреймворки для обработки данных и поддержку инженерного персонала Nvidia. На GTC 2023 компания также представила ряд других ИИ-систем. Среди них: 📌 облако DGX Cloud, позволяющее арендовать мощную вычислительную ИИ-инфраструктуру и ПО Nvidia через браузер; 📌 платформы логического вывода L4 для повышения производительности видео, L40 — создания 2D/3D изображений, NVL — развертывания больших языковых моделей и Grace Hopper — разработки рекомендательных систем; 📌 система Isaac Sim для совместной работы над умными устройствами; 📌 рабочий процесс Omniverse для автопроизводителей; Также компания открыла клиентам доступ к ИИ-ускорителям H100 Hopper. #Nvidia

Hashtags

🪄Nvidiaпредставила ИИ-генератор трехмерных объектов по тексту Magic3D. Система базируется на алгоритме eDiffii. Сперва модель преобразовывает запрос в изображения низкого разрешения, которые затем обрабатываются в исходное 3D-представление с помощью фреймворка Instant NGP. 🖼 После этого ИИ-алгоритм DMTet извлекает трехмерную сетку более высокого качества. Это служит шаблоном для дальнейших изображений, масштаб которых увеличивается. По словам Nvidia, в результате получается трехмерная модель объекта размером 512×512 пикселей, которую можно импортировать и визуализировать в стандартном графическом ПО. 💬 В компании заявили, что Magic3D по скорости и разрешению превосходит ИИ-генератор Google DreamFusion. #Nvidia

Hashtags

⚙️Nvidia задействовала графические процессоры и алгоритмы машинного обучения для проектирования новых видеоускорителей. В компании утвеждают, что ИИ можно эффективно применять в таких областях проектирования GPU, как картирование падения напряжения, прогнозирование паразитных явлений, проблемы размещения и маршрутизации, автоматизация стандартной миграции ячеек. 📉 Картирование падения напряжения показывает инженерам, как распределяется мощность в новых процессорах. По данным Nvidia, использование ИИ позволило сократить время произведения расчетов с трех часов до трех секунд с точностью 94%. Также инженеры использовали графовые нейросети для анализа проблемы размещения и маршрутизации компонентов процессора, так как неправильное выполнение этого условия приведет к «пробкам данных». ⚒ Кроме того, переход с 7-нм на 5-нм техпроцесс производства чипов требовал больших трудозатрат, а обучение с подкреплением помогло ускорить этот этап и уменьшить количество ошибок в правилах проектирования. #Nvidia

Hashtags

🖼Nvidiaвыпустила инструмент Canvas для генерации фотореалистичных пейзажей по наброску, основанный на нейросети GauGAN. Для создания изображения пользователю доступны 15 материалов, такие как трава, туман или снег, а также девять стилей, в зависимости от которых меняется освещение и другие детали. Изображение можно разделить на слои, чтобы по отдельности редактировать каждую часть картинки. 🖥 Опробовать Canvas могут все желающие, однако для его работы требуется видеокарта Nvidia c ядрами RT для трассировки лучей из серии RTX. #Nvidia

Hashtags

👀NVIDIAоткроет доступ к облачному суперкомпьютеру DGX SuperPOD для разработки искусственного интеллекта по подписке за $90 000 в месяц. Пользователям сервиса установят готовое комплексное решение для центров обработки данных, что повысит производительность их инфраструктуры. DGX SuperPOD обладает вычислительной мощностью в 100 петафлопс. Аналогичные суперкомпьютеры используются в немецком исследовательском центре ИИ для анализа спутниковых и аэроснимков, а также в университете Флориды для молекулярного моделирования белков с квантовой точностью. 📆 Сервис станет доступен летом 2021 года. #NVIDIA

Hashtags

🎮 Nvidia запатентовала технологию машинного обучения для тактильного фидбека в игровых контроллерах. На сегодняшний день разработчики видеоигр заранее программируют моменты срабатывания тактильной отдачи. Вместо этого специалисты Nvidia предлагают обучить искусственный интеллект распознавать «особые» моменты внутри игры в режиме реального времени и самостоятельно выбирать варианты обратной связи с игроком. ⚙️ О том, как будет работать технология в патенте практически ничего не сказано. Вероятно, обработка алгоритмов будет происходить на CPU, графическом процессоре, либо же на комбинации аппаратного и программного обеспечения. #Nvidia

Hashtags

Earth&Climate Tech

@earth_climate_tech · Post #297 · 22.05.2023, 16:00

ChatGPT для климатических вопросов и ответов На Hugging Face есть милейший чат бот, который отвечает на все вопросы, касающиеся климата. Работает с помощью больших языковых моделей и при взаимодействии с ChatGPT API. Бот обучен в основном на документах межправительственной комиссии по изменению климата (IPCC), поэтому не понимает, когда его спрашивают про что-то другое. Задаете вопрос, получаете развернутый ответ со ссылками на документы IPCC. Это интересный пример внедрения больших языковых моделей обученных на корпусе внутренних документов. #AI#climate#LLM

#AI Немного ИИ-теории ❗️В недавнем иске против компании OpenAI Илон Маск утверждал, что GPT-4 является ранним AGI, по сути равным человеческому интеллекту. Что же такое AGI и когда он появится? 👤Сэм Альтман, CEO Open AI определяет AGI (artificial general intelligence) как интеллект, равный уровню обычного человека, который можно было бы принять в команду как сотрудника. Также популярно определение AGI как «системы, способной выполнить любую когнитивную задачу, доступную человеку». 📎Для справки: существует несколько видов (уровней развития) ИИ, а именно узкий ИИ (narrow, ANI), общий ИИ (genreal, AGI) и супер ИИ (super AI, ASI). ⏲Исследователи никак не могут прийти к консенсусу относительно даты появления AGI. По результатам Expert Survey on Progress in AI, существует 50% шанс того, что AGI появится до 2059 года. Тем не менее, поле ИИ изменяется постоянно и становится сложным оставаться в курсе событий. ⭐️Для этого мы нашли крупнейшее русскоязычное AGI-сообщество agirussia.org — у них есть канал и группа в Telegram. 🌐еще проходят еженедельные онлайн-семинары по тематике AGI на русском языке, записи семинаров за последние несколько лет доступны на YouTube и их сообществе в ВК. Держим руку на пульсе ИИ⭐ ⭐️Автор, Анна, @qcuqueen

Hashtags

ForgetMe | Нейросети

@forgetmeai · Post #5662 · 30.11.2025, 15:25

⚡️Ноам Браун: вокруг ИИ гораздо больше согласия, чем кажется Ведущий исследователь OpenAI Ноам Браун предлагает не вестиcь на медийную «чёрно-белую» картинку. В соцсетях спор об ИИ часто сводят к карикатурам — от «LLM мёртвы» до «суперинтеллект завтра». Но если слушать именно исследователей, картина неожиданно консенсусная. О чём эксперты в целом согласны: 🟡Текущих подходов уже достаточно, чтобы дать огромный экономический и социальный эффект, даже без новых научных прорывов. 🟡Для AGI/ASI прорывы всё же понадобятся — часто упоминают continual learning и sample efficiency. 🟡Горизонт — до 20 лет (средняя оценка ≈10 лет). Никто не говорит о фантазиях или «100+ лет до суперинтеллекта». Я в целом с ним согласен. Подробнее в треде Брауна: X (Ноам Браун) 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#llm