Воттоваара — хорошее место для первой в вашей жизни горной экскурсии. Там всего по чуть-чуть: чуть-чуть подъёма (максимальный уклон градусов 60 от горизонта), чуть-чуть горной тропы (длина пути до верха около 2км), чуть-чуть высоты (417 метров). Хардкорные трекеры и хайкеры преодолевают такие участки одной ногой, не прекращая завтрак. Но неподготовленный человек сможет понять, есть ли для него смысл пытаться идти в какие-то более сложные горы.
Даже "заброс" на гору есть. Но если в больших горах это вертолёт или вездеход по болоту, то здесь вас около часа везут на внедорожнике через камни и лужи метровой глубины. Да, обычный автомобиль (даже кроссовер) там не пройдёт совершенно никак, нужен высокий, полноприводный и обязательно со шнорхелем. Но это всё равно более доступная территория, чем какое-нибудь Плато Путорана, куда вообще не рекомендуют соваться туристам без хорошего опыта пеших походов.
Впрочем, тут ироничный момент. База отдыха на подъезде живёт исключительно на туристах, которые хотят посетить Воттоваару. Теоретически она могла бы проспонсировать если не асфальтирование, то хотя бы проход грейдера по "дороге" и присыпку грунтом: это существенно уменьшило бы степень опасности для людей и степень износа техники, а также значительно подняло бы удобство и скорость доставки. Но тогда люди могли бы добраться на своих машинах и не брать на базе дорогой трансфер. Думаю, в какой-то момент и внедорожники потеряют способность проезжать там, нужен будет гусеничный вездеход.
Прикольно, что, чем выше идёшь, тем ниже деревья. Гора как бы награждает тебя за усилия всё более красивыми и просторными видами. В целом территория будто бы инопланетная. Очень странно себя там чувствуешь — ты словно и не на Земле уже, и вообще не в реальности, а внутри какого-то странного рисунка.
#travel
🌟OpenReasoning-Nemotron: набор ризонинг-моделей от NVIDIA.
OpenReasoning-Nemotron - набор LLM на архитектуре Qwen 2.5 и дистиллированных из DeepSeek-R1-0528 ( 671 млрд. параметров):
🟠OpenReasoning-Nemotron-1.5B;
🟠OpenReasoning-Nemotron-7B;
🟠OpenReasoning-Nemotron-14B;
🟢OpenReasoning-Nemotron-32B;
Семейство было обучено на 5 млн. примеров рассуждений в математике, естественных науках и программировании.
Модели показали достойные результаты pass@1 на бенчах GPQA, MMLU-PRO, AIME, HMMT и LiveCodeBench - без использования RL.
Старшая модель, 32B, выбила 96,7% по HMMT с декодированием GenSelect.
📌Лицензирование: CC-BY-4.0 License.
🟡Статья
🟡Набор моделей
@ai_machinelearning_big_data
#AI#ML#LLM#Reasoning#Nemotron#NVIDIA
🌟NVIDIA Nemotron-Cascade 2: MoE на 30B параметров и золото на математических олимпиадах.
Nemotron-Cascade 2 - вторая в мире открытая языковая модель, получившая золотую медаль сразу на 3 соревнованиях 2025 года: IMO, IOI и финале ICPC.
До нее это удавалось только DeepSeek-V3.2-Speciale, модели с 671B параметров и 37B активных. У Nemotron-Cascade 2 параметров в 20 раз меньше: 30B общих, 3B активных.
🟠На IMO 2025 модель решила 5 задач из 6 и набрала 35 из 42 баллов.
🟠На IOI - 439 из 600, что соответствует золоту.
🟠На ICPC World Finals 10 задач из 12, это 4 место в золотой зоне. При этом 8 задач ICPC были решены менее чем за 100 попыток.
🟡Архитектура
MoExperts на базе Nemotron-3-Nano-30B-A3B-Base. Отличие от первой версии - расширенный Cascade RL, где обучение с подкреплением проходит последовательно по доменам: сначала следование инструкциям, затем мультидоменное RL, потом дистилляция, RLHF, работа с длинным контекстом, код и, наконец, задачи программной инженерии.
🟡Multi-Domain On-Policy Distillation (MOPD)
На каждом этапе Cascade RL выбирается лучший промежуточный чекпоинт по конкретному домену и используется как учитель. Поскольку все учителя происходят от одной SFT-инициализации, они делят токенайзер и словарь, что упрощает дистилляцию.
MOPD работает на уровне отдельных токенов, а не последовательностей, и сходится быстрее, чем классический GRPO: на AIME 2025 достигает уровня учителя за 30 шагов оптимизации.
🟡Тесты
На бенчмарках модель обходит Qwen3.5-35B-A3B и более крупную Nemotron-3-Super-120B-A12B в математике, коде и следованию инструкциям.
🟢LiveCodeBench v6: 88.4 (у Qwen3.5 74.6);
🟢ArenaHard v2: 83.5 против 65.4 у Qwen3.5;
🟢IFBench: 82.9 против 70.2;
🟢На Codeforces модель набрала рейтинг 2345 с TIR (на уровне моделей с 300B+ параметров).
🟡Слабые места
Задачи, требующие глубоких знаний (MMLU-Pro, GPQA-Diamond) и агентные сценарии (BFCL v4, τ²-Bench, SWE Verified). Тут Qwen3.5 пока впереди.
NVIDIA обещает подтянуть наукоёмкий претрейн и агентный RL в следующих версиях Nemotron-Cascade.
📌Лицензирование: NVIDIA Open Model License.
🟡Модель
🟡SFT-датасет
🟡RL-данные
🟡Техотчет
@ai_machinelearning_big_data
#AI#ML#LLM#Nemotron#Cascade2#NVIDIA