TGTGInsighttelegram intelligenceLIVE / telegram public index
← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #8349

@ai_machinelearning_big_data

Machinelearning

Views61,800Post view count
PostedAug 2408/24/2025, 09:01 AM
Post content

Post content

πŸ“ŒΠΠ½Π°Ρ‚ΠΎΠΌΠΈΠΈ GPU ΠΈ TPU: 12 Π³Π»Π°Π²Π° пособия "How to Scale Your Model" Π“Ρ€ΡƒΠΏΠΏΠ° ΠΈΠ½ΠΆΠ΅Π½Π΅Ρ€ΠΎΠ² ΠΈΠ· Google DeepMind ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»ΠΈ 12-ю Π³Π»Π°Π²Ρƒ своСго ΠΎΠ½-Π»Π°ΠΉΠ½ ΡƒΡ‡Π΅Π±Π½ΠΈΠΊΠ° "How to Scale Your Model: A Systems View of LLMs on TPUs" How to Scale Your Model - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠΎ-ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠ΅ руководство ΠΏΠΎ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ LLM ΠΈΠ· 12 Ρ€Π°Π·Π΄Π΅Π»ΠΎΠ² для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΎΠ² ΠΈ исслСдоватСлСй. Оно ΠΎΠ±ΡŠΡΡΠ½ΡΠ΅Ρ‚, ΠΊΠ°ΠΊ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, учитывая систСмныС рСсурсы: вычислСния, ΠΏΠ°ΠΌΡΡ‚ΡŒ ΠΈ ΠΏΡ€ΠΎΠΏΡƒΡΠΊΠ½ΡƒΡŽ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ. ПособиС Π½Π°ΡƒΡ‡ΠΈΡ‚ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ стратСгии ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΠΈΠ·ΠΌΠ°, ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒ ΠΈ врСмя обучСния ΠΈ инфСрСнса, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π³Π»ΡƒΠ±ΠΆΠ΅ ΠΏΠΎΠ½ΡΡ‚ΡŒ взаимодСйствиС ΠΌΠ΅ΠΆΠ΄Ρƒ TPU/GPU ΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ ΠΊΠ°ΠΊ Π½Π° ΠΎΠ΄Π½ΠΎΠΌ, Ρ‚Π°ΠΊ ΠΈ Π½Π° тысячах ускоритСлСй. 12-я Π³Π»Π°Π²Π° - Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ΅ тСхничСскоС руководство ΠΏΠΎ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ GPU ΠΈ стратСгиям ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π’ Π½Π΅ΠΉ Π΄Π΅Ρ‚Π°Π»ΡŒΠ½ΠΎ разбираСтся устройство соврСмСнных GPU NVIDIA: Streaming Multiprocessors, Tensor Cores, иСрархия памяти (HBM, L2, SMEM), всС это с ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Ρ‹ΠΌΠΈ ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ Ρ‚Π°Π±Π»ΠΈΡ†Π°ΠΌΠΈ характСристик для Ρ€Π°Π·Π½Ρ‹Ρ… ΠΏΠΎΠΊΠΎΠ»Π΅Π½ΠΈΠΉ Ρ‡ΠΈΠΏΠΎΠ². ΠžΡ‡Π΅Π½ΡŒ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½ΠΎ Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΎ сравнСниС Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ GPU ΠΈ TPU, с объясняСм ΠΊΠ»ΡŽΡ‡Π΅Π²ΠΎΠ³ΠΎ различия ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΌΠΎΠ΄ΡƒΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ GPU ΠΈ ΠΌΠΎΠ½ΠΎΠ»ΠΈΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ TPU. ОсобоС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ Ρ€Π΅Π΄ΠΊΠΎΡΡ‚ΡŒ для ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ², ΡƒΠ΄Π΅Π»Π΅Π½ΠΎ сСтСвой ΠΎΡ€Π³Π°Π½ΠΈΠ·Π°Ρ†ΠΈΠΈ кластСров. Авторы доступно ΠΎΠ±ΡŠΡΡΠ½ΡΡŽΡ‚ ΠΊΠ°ΠΊ GPU ΡΠΎΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ Π²Π½ΡƒΡ‚Ρ€ΠΈ ΡƒΠ·Π»ΠΎΠ² Ρ‡Π΅Ρ€Π΅Π· NVLink/NVSwitch ΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ ΡƒΠ·Π»Π°ΠΌΠΈ Ρ‡Π΅Ρ€Π΅Π· InfiniBand Π² Ρ‚ΠΎΠΏΠΎΠ»ΠΎΠ³ΠΈΠΈ "Fat tree", ΠΈ ΠΊΠ°ΠΊ пропускная ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅ влияСт Π½Π° Ρ€Π΅Π°Π»ΡŒΠ½ΡƒΡŽ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΊΠΎΠ»Π»Π΅ΠΊΡ‚ΠΈΠ²Π½Ρ‹Ρ… ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ (AllReduce, AllGather). ΠžΠΏΠΈΡΠ°Π½Ρ‹ основныС стратСгии ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΠΈΠ·ΠΌΠ°: Data Parallelism, Tensor Parallelism, Expert Parallelism ΠΈ Pipeline Parallelism, с Ρ€Π°Π·Π±ΠΎΡ€ΠΎΠΌ ΠΈΡ… ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠΉ ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² ΠΈΠ· Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ². Π’ ΠΊΠΎΠ½Ρ†Π΅ Π³Π»Π°Π²Ρ‹ Π΅ΡΡ‚ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΉ Π°Π½Π°Π»ΠΈΠ· Π½ΠΎΠ²Ρ‹Ρ… возмоТностСй Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹ Blackwell. @ai_machinelearning_big_data #AI#ML#LLM#Scaling#GPU#TPU