Π‘ΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ΅
π₯ NVIDIA ΠΎΠΏΡΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»ΠΈ Π³Π°ΠΉΠ΄: ΠΊΠ°ΠΊ ΠΌΠ°ΡΡΡΠ°Π±ΠΈΡΠΎΠ²Π°ΡΡ Π±ΠΈΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠ΅ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠΡΡ ΡΠ²ΠΎΠ΄ΠΈΡΡΡ ΠΊ ΡΡΡΠΌ ΠΊΠ»ΡΡΠ΅Π²ΡΠΌ ΠΈΠ΄Π΅ΡΠΌ: 1) ΠΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Transformer Engine ΠΏΠΎΠ΄ΠΌΠ΅Π½ΡΠ΅Ρ ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΡΠ΅ Π±Π»ΠΎΠΊΠΈ Π½Π° ΠΎΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ Π²Π΅ΡΡΠΈΠΈ: ΠΌΠ΅Π½ΡΡΠ΅ ΠΏΠ°ΠΌΡΡΠΈ, Π±ΡΡΡΡΠ΅Π΅ ΠΌΠ°ΡΡΠΈΡΠ½ΡΠ΅ ΠΎΠΏΠ΅ΡΠ°ΡΠΈΠΈ, ΠΏΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° FP8/FP4. ΠΡΠΎ ΡΡΠ°Π·Ρ ΡΠ²Π΅Π»ΠΈΡΠΈΠ²Π°Π΅Ρ ΡΠΊΠΎΡΠΎΡΡΡ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ ΠΈ ΠΈΠ½ΡΠ΅ΡΠ΅Π½ΡΠ°. 2) ΠΠ°ΡΡΡΠ°Π±ΠΈΡΠΎΠ²Π°ΡΡ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ Π΄ΠΎ ΠΌΠΈΠ»Π»ΠΈΠ°ΡΠ΄ΠΎΠ² ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ² Π§Π΅ΡΠ΅Π· FSDP ΠΈ Π³ΠΈΠ±ΡΠΈΠ΄Π½ΡΠ΅ ΡΠ΅ΠΆΠΈΠΌΡ ΠΏΠ°ΡΠ°Π»Π»Π΅Π»ΠΈΠ·ΠΌΠ° ΠΌΠΎΠΆΠ½ΠΎ ΡΠ°Π·Π½Π΅ΡΡΠΈ ΠΌΠΎΠ΄Π΅Π»Ρ ΠΏΠΎ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΠΌ GPU ΠΈΠ»ΠΈ ΡΠ·Π»Π°ΠΌ. Π Π³Π»Π°Π²Π½ΠΎΠ΅, ΠΊΠΎΠ½ΡΠΈΠ³ΡΡΠ°ΡΠΈΡ ΡΠΆΠ΅ Π³ΠΎΡΠΎΠ²Π°, Π½Π΅ Π½ΡΠΆΠ½ΠΎ ΡΠΎΠ±ΠΈΡΠ°ΡΡ Π²ΡΡ Π²ΡΡΡΠ½ΡΡ. 3) ΠΠΊΠΎΠ½ΠΎΠΌΠΈΡΡ ΠΏΠ°ΠΌΡΡΡ Π·Π° ΡΡΡΡ sequence packing ΠΠ±ΡΡΠ½ΠΎ Π±ΠΈΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΡΠ½ΠΎΡΡΠΈ ΡΠΈΠ»ΡΠ½ΠΎ ΡΠ°Π·Π»ΠΈΡΠ°ΡΡΡΡ Π² Π΄Π»ΠΈΠ½Π΅, ΠΈ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Π° Π±Π°ΡΡΠ° Π·Π°Π±ΠΈΡΠ° ΠΏΠ°Π΄Π΄ΠΈΠ½Π³Π°ΠΌΠΈ. Packing ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Β«ΡΠΆΠΈΠΌΠ°ΡΡΒ» Π±Π°ΡΡ, ΡΠ±ΠΈΡΠ°Ρ ΠΏΡΡΡΡΠ΅ ΡΠΎΠΊΠ΅Π½Ρ, ΠΈΡΠΎΠ³: Π²ΡΡΠ΅ ΡΠΊΠΎΡΠΎΡΡΡ, ΠΌΠ΅Π½ΡΡΠ΅ VRAM. ΠΠΈΡΠ°ΡΡ CUDA-ΡΠ΄ΡΠ° Π²ΡΡΡΠ½ΡΡ Π½ΠΈΠΊΡΠΎ Π½Π΅ Ρ ΠΎΡΠ΅Ρ. BioNeMo Recipes ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΏΡΠΈΠ²ΡΡΠ½ΡΠΉ ΡΡΠ΅ΠΊ PyTorch + HuggingFace, Π½ΠΎ ΠΏΡΠΈ ΡΡΠΎΠΌ ΠΏΠΎΠ»ΡΡΠ°ΡΡ ΠΏΡΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡΠ΅Π»ΡΠ½ΠΎΡΡΡ ΡΡΠΎΠ²Π½Ρ Β«Π±ΠΎΠ»ΡΡΠΈΡ Β» ΡΡΠ΅ΠΉΠΌΠ²ΠΎΡΠΊΠΎΠ². https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/ @ai_machinelearning_big_data #NVIDIA