← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #9047

@ai_machinelearning_big_data

Machinelearning

ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€Ρ‹32,000ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ просмотров
ΠžΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½22 нояб.22.11.2025, 09:04
Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅ поста

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅

πŸ–₯ NVIDIA ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»ΠΈ Π³Π°ΠΉΠ΄: ΠΊΠ°ΠΊ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ биологичСскиСмодСли. Всё сводится ΠΊ Ρ‚Ρ€Ρ‘ΠΌ ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹ΠΌ идСям: 1) Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Transformer Engine подмСняСт стандартныС Π±Π»ΠΎΠΊΠΈ Π½Π° ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ вСрсии: мСньшС памяти, быстрСС ΠΌΠ°Ρ‚Ρ€ΠΈΡ‡Π½Ρ‹Π΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ, ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° FP8/FP4. Π­Ρ‚ΠΎ сразу ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π΅Ρ‚ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ обучСния ΠΈ инфСрСнса. 2) ΠœΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π΄ΠΎ ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄ΠΎΠ² ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π§Π΅Ρ€Π΅Π· FSDP ΠΈ Π³ΠΈΠ±Ρ€ΠΈΠ΄Π½Ρ‹Π΅ Ρ€Π΅ΠΆΠΈΠΌΡ‹ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΠΈΠ·ΠΌΠ° ΠΌΠΎΠΆΠ½ΠΎ разнСсти модСль ΠΏΠΎ нСскольким GPU ΠΈΠ»ΠΈ ΡƒΠ·Π»Π°ΠΌ. И Π³Π»Π°Π²Π½ΠΎΠ΅, конфигурация ΡƒΠΆΠ΅ Π³ΠΎΡ‚ΠΎΠ²Π°, Π½Π΅ Π½ΡƒΠΆΠ½ΠΎ ΡΠΎΠ±ΠΈΡ€Π°Ρ‚ΡŒ всё Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ. 3) Π­ΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ ΠΏΠ°ΠΌΡΡ‚ΡŒ Π·Π° счёт sequence packing ΠžΠ±Ρ‹Ρ‡Π½ΠΎ биологичСскиС ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ сильно Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ Π² Π΄Π»ΠΈΠ½Π΅, ΠΈ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Π° Π±Π°Ρ‚Ρ‡Π° Π·Π°Π±ΠΈΡ‚Π° ΠΏΠ°Π΄Π΄ΠΈΠ½Π³Π°ΠΌΠΈ. Packing позволяСт Β«ΡΠΆΠΈΠΌΠ°Ρ‚ΡŒΒ» Π±Π°Ρ‚Ρ‡, убирая пустыС Ρ‚ΠΎΠΊΠ΅Π½Ρ‹, ΠΈΡ‚ΠΎΠ³: Π²Ρ‹ΡˆΠ΅ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ, мСньшС VRAM. ΠŸΠΈΡΠ°Ρ‚ΡŒ CUDA-ядра Π²Ρ€ΡƒΡ‡Π½ΡƒΡŽ Π½ΠΈΠΊΡ‚ΠΎ Π½Π΅ Ρ…ΠΎΡ‡Π΅Ρ‚. BioNeMo Recipes ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΠ²Ρ‹Ρ‡Π½Ρ‹ΠΉ стСк PyTorch + HuggingFace, Π½ΠΎ ΠΏΡ€ΠΈ этом ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ уровня Β«Π±ΠΎΠ»ΡŒΡˆΠΈΡ…Β» Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠΎΠ². https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/ @ai_machinelearning_big_data #NVIDIA