🖥Как выжать максимум из маленькой LLM? Ответ — долго и грамотно учить.
NVIDIA показала, как 1.5B-модель можно раскачать до топовых результатов в логике, математике, коду и STEM-задачам — без увеличения параметров модели.
📈 Результат после месяцев обучения:
+55% к логическим задачам
+14.7% к математике
+13.9% к коду
+25.1% к сложным STEM-вопросам
🛠 Как они это сделали:
– Использовали RL (обучение с подкреплением) на 5 типах задач, включая 40K примеров по математике и 24K по программированию
– Все ответы проверялись автоматически в "песочнице", которая оценивает, правильный ли результат
– Применили улучшенную стратегию обучения — *Group Relative Policy Optimization* — и добавили несколько хитрых трюков:
🟢Decoupled clipping — обычно модель "обрезает" редкие и неожиданные токены, чтобы не уходить слишком в сторону от главного. Но здесь этот механизм ослаблен: модель может чаще выбирать нестандартные слова, что помогает ей находить неожиданные, но правильные решения.
🟢Dynamic sampling — модель *не тратит время* на лишком лёгкие задачи. Она пропускает такие примеры и фокусируется на тех, где действительно можно чему-то научиться.
🟢Маленький KL-штраф (0.0001) — KL показывает, насколько поведение модели отклоняется от старой версии (эталона). Здесь штраф почти нулевой, чтобы не мешать экспериментам, но всё ещё предотвращать полное "сумасшествие" модели.
🟢Сброс каждые 400 шагов — модель регулярно сбрасывает и policy (поведение), и оптимизатор. Это как регулярная перезагрузка — модель забывает вредные привычки, но сохраняет полезные навыки.
🟢Температура 1.2 и длинный контекст (8K → 16K) — высокая температура делает поведение модели более разнообразным. А длинный контекст помогает учитывать больше информации при генерации ответа.
Все эти приёмы помогли сохранить интерес модели к поиску новых решений, а не скатываться к заученным паттернам.
Итог: модель не "застывает", а продолжает исследовать — и выдает стабильный рост качества без расширения архитектуры.
📄 Почитать статью полностью : arxiv.org/abs/2507.12507
@ai_machinelearning_big_data
#ml#ai#nvidia
Polymathic - междисциплинарный ИИ
Ох, какая классная межуниверситетская инициатива - Polymathic🔥.
Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п.
В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков.
На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI.
#AI#ML
⚙️Nvidia на мероприятии GTC 2023представила набор облачных сервисов AI Foundations для разработки искусственного интеллекта.
По данным техгиганта, с его помощью компании смогут создавать, совершенствовать и использовать крупноязыковые и генеративные ИИ-алгоритмы, обучая их на собственных данных, для решения уникальных задач.
🪄 В AI Foundations входят языковой сервис NeMo и платформа Picasso для генерации изображений, видео и 3D. Оба продукта включают предварительно обученные модели, API-интерфейсы, оптимизированные механизмы логического вывода, фреймворки для обработки данных и поддержку инженерного персонала Nvidia.
На GTC 2023 компания также представила ряд других ИИ-систем. Среди них:
📌 облако DGX Cloud, позволяющее арендовать мощную вычислительную ИИ-инфраструктуру и ПО Nvidia через браузер;
📌 платформы логического вывода L4 для повышения производительности видео, L40 — создания 2D/3D изображений, NVL — развертывания больших языковых моделей и Grace Hopper — разработки рекомендательных систем;
📌 система Isaac Sim для совместной работы над умными устройствами;
📌 рабочий процесс Omniverse для автопроизводителей;
Также компания открыла клиентам доступ к ИИ-ускорителям H100 Hopper.
#Nvidia
🪄Nvidiaпредставила ИИ-генератор трехмерных объектов по тексту Magic3D.
Система базируется на алгоритме eDiffii. Сперва модель преобразовывает запрос в изображения низкого разрешения, которые затем обрабатываются в исходное 3D-представление с помощью фреймворка Instant NGP.
🖼 После этого ИИ-алгоритм DMTet извлекает трехмерную сетку более высокого качества. Это служит шаблоном для дальнейших изображений, масштаб которых увеличивается.
По словам Nvidia, в результате получается трехмерная модель объекта размером 512×512 пикселей, которую можно импортировать и визуализировать в стандартном графическом ПО.
💬 В компании заявили, что Magic3D по скорости и разрешению превосходит ИИ-генератор Google DreamFusion.
#Nvidia
⚙️Nvidia задействовала графические процессоры и алгоритмы машинного обучения для проектирования новых видеоускорителей.
В компании утвеждают, что ИИ можно эффективно применять в таких областях проектирования GPU, как картирование падения напряжения, прогнозирование паразитных явлений, проблемы размещения и маршрутизации, автоматизация стандартной миграции ячеек.
📉 Картирование падения напряжения показывает инженерам, как распределяется мощность в новых процессорах. По данным Nvidia, использование ИИ позволило сократить время произведения расчетов с трех часов до трех секунд с точностью 94%.
Также инженеры использовали графовые нейросети для анализа проблемы размещения и маршрутизации компонентов процессора, так как неправильное выполнение этого условия приведет к «пробкам данных».
⚒ Кроме того, переход с 7-нм на 5-нм техпроцесс производства чипов требовал больших трудозатрат, а обучение с подкреплением помогло ускорить этот этап и уменьшить количество ошибок в правилах проектирования.
#Nvidia
🖼Nvidiaвыпустила инструмент Canvas для генерации фотореалистичных пейзажей по наброску, основанный на нейросети GauGAN.
Для создания изображения пользователю доступны 15 материалов, такие как трава, туман или снег, а также девять стилей, в зависимости от которых меняется освещение и другие детали.
Изображение можно разделить на слои, чтобы по отдельности редактировать каждую часть картинки.
🖥 Опробовать Canvas могут все желающие, однако для его работы требуется видеокарта Nvidia c ядрами RT для трассировки лучей из серии RTX.
#Nvidia
👀NVIDIAоткроет доступ к облачному суперкомпьютеру DGX SuperPOD для разработки искусственного интеллекта по подписке за $90 000 в месяц.
Пользователям сервиса установят готовое комплексное решение для центров обработки данных, что повысит производительность их инфраструктуры.
DGX SuperPOD обладает вычислительной мощностью в 100 петафлопс. Аналогичные суперкомпьютеры используются в немецком исследовательском центре ИИ для анализа спутниковых и аэроснимков, а также в университете Флориды для молекулярного моделирования белков с квантовой точностью.
📆 Сервис станет доступен летом 2021 года.
#NVIDIA
🎮 Nvidia запатентовала технологию машинного обучения для тактильного фидбека в игровых контроллерах.
На сегодняшний день разработчики видеоигр заранее программируют моменты срабатывания тактильной отдачи. Вместо этого специалисты Nvidia предлагают обучить искусственный интеллект распознавать «особые» моменты внутри игры в режиме реального времени и самостоятельно выбирать варианты обратной связи с игроком.
⚙️ О том, как будет работать технология в патенте практически ничего не сказано. Вероятно, обработка алгоритмов будет происходить на CPU, графическом процессоре, либо же на комбинации аппаратного и программного обеспечения.
#Nvidia
Nvidia совершила значительный скачок в «ловкости» роботов благодаря ИИ-инструменту Eureka, который обучает механизмы сложным навыкам вроде вращения ручкой. Нейросеть также научила роботов открывать ящики и шкафы, бросать и ловить мячи, использовать ножницы и выполнять другие задачи.
Eureka основана на большой языковой модели GPT-4 от OpenAI Сэма Альтмана и использует генеративный ИИ для написания кода.
#Nvidia#роботы
#AI
Немного ИИ-теории
❗️В недавнем иске против компании OpenAI Илон Маск утверждал, что GPT-4 является ранним AGI, по сути равным человеческому интеллекту.
Что же такое AGI и когда он появится?
👤Сэм Альтман, CEO Open AI определяет AGI (artificial general intelligence) как интеллект, равный уровню обычного человека, который можно было бы принять в команду как сотрудника. Также популярно определение AGI как «системы, способной выполнить любую когнитивную задачу, доступную человеку».
📎Для справки: существует несколько видов (уровней развития) ИИ, а именно узкий ИИ (narrow, ANI), общий ИИ (genreal, AGI) и супер ИИ (super AI, ASI).
⏲Исследователи никак не могут прийти к консенсусу относительно даты появления AGI. По результатам Expert Survey on Progress in AI, существует 50% шанс того, что AGI появится до 2059 года. Тем не менее, поле ИИ изменяется постоянно и становится сложным оставаться в курсе событий.
⭐️Для этого мы нашли крупнейшее русскоязычное AGI-сообщество agirussia.org — у них есть канал и группа в Telegram.
🌐еще проходят еженедельные онлайн-семинары по тематике AGI на русском языке, записи семинаров за последние несколько лет доступны на YouTube и их сообществе в ВК.
Держим руку на пульсе ИИ⭐
⭐️Автор, Анна, @qcuqueen
Хакатончик от Xeek
Two Birds, One Neural Network - так называется новый хакатон от Xeek в области Generative AI. Звучит как-будто нужно сделать свой Dalle-E2, но на самом деле, задача выглядит немного иначе. По условиям хакатона, участникам нужно сделать нейронную сеть, которая максимизирует разнообразие генерируемых результатов, отвечающих двум условиям. Авторы хакатона проводят параллели с добавлением двух геофизических измерений для ограничения сценариев геологических моделей. Буквально, нужно построить нейронную сеть, которая генерирует разнообразные значения x0, x1, сохраняя при этом их природу в виде нисходящих или восходящих прямых линий, удовлетворяющих заданным функциям y1, y2, как показано на картинке.
Более подробное описание - тут. Призовой фонд $40К (первое место $19.5K).
#hackathon#AI#ML