← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #9483

@ai_machinelearning_big_data

Machinelearning

ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€Ρ‹27,000ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ просмотров
ΠžΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½6 Ρ„Π΅Π²Ρ€.06.02.2026, 14:53
Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅ поста

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅

🌟Intern-S1-Pro: триллионная MoE для Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡. Shanghai AI Laboratory ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° Intern-S1-Pro, ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠΌΠΎΠ΄Π°Π»ΡŒΠ½ΡƒΡŽ модСль Π½Π° Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ MoE с ΠΎΠ±Ρ‰ΠΈΠΉ объСмом ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π² 1 Ρ‚Ρ€ΠΈΠ»Π»ΠΈΠΎΠ½. Π’Π½ΡƒΡ‚Ρ€ΠΈ 512 экспСртов, ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Ρ‚ΠΎΠΊΠ΅Π½Π° Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΡƒΡŽΡ‚ΡΡ 8, Ρ‡Ρ‚ΠΎ Π΄Π°Π΅Ρ‚ 22 ΠΌΠ»Ρ€Π΄. Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹Ρ… ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΏΡ€ΠΈ инфСрСнсС. Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΎΠ½ΠΈΡ€ΡƒΡŽΡ‚ Π½ΠΎΠ²ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊ AI4Science - Π»ΡƒΡ‡ΡˆΠ΅Π΅ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ для слоТных Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… вычислСний ΠΈ рассуТдСний. ВмСсто ΠΎΡ‡Π΅Ρ€Π΅Π΄Π½ΠΎΠΉ ΠΏΠΎΠΏΡ‹Ρ‚ΠΊΠΈ ΡƒΠΌΠ΅Ρ‚ΡŒ всС ΠΈ сразу, модСль Π·Π°Ρ‚ΠΎΡ‡ΠΈΠ»ΠΈ ΠΏΠΎΠ΄ Π½Π°ΡƒΠΊΡƒ : Ρ…ΠΈΠΌΠΈΡŽ, ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅, Π½Π°ΡƒΠΊΠΈ ΠΎ Π—Π΅ΠΌΠ»Π΅. Авторы ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ Π² этих Π½ΠΈΡˆΠ°Ρ… ΠΎΠ½Π° ΠΈΠ΄Π΅Ρ‚ Π½Π° Ρ€Π°Π²Π½Ρ‹Ρ… с Ρ‚ΠΎΠΏΠΎΠ²Ρ‹ΠΌΠΈ коммСрчСскими модСлями. ВСхничСски интСрСсная ΡˆΡ‚ΡƒΠΊΠ° - ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° Π΄Π»ΠΈΠ½Π½Ρ‹Ρ… Π³Π΅Ρ‚Π΅Ρ€ΠΎΠ³Π΅Π½Π½Ρ‹Ρ… Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… рядов (ΠΎΡ‚ Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π΄ΠΎ ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° Ρ‚ΠΎΡ‡Π΅ΠΊ), Π·Π° ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ большоС спасибо Fourier Position Encoding (FoPE). Π­Ρ‚ΠΎ ваТная Ρ‚Π΅ΠΌΠ° для ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΡ€Π΅Ρ‚Π°Ρ†ΠΈΠΈ физичСских сигналов ΠΈ ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. FoPE - способ ΠΏΡ€ΠΈΠΊΡ€Π΅ΠΏΠΈΡ‚ΡŒ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ Ρ‚ΠΎΠΊΠ΅Π½Ρƒ Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π΅Π³ΠΎ ΠΏΠΎΠ·ΠΈΡ†ΠΈΡŽ Π½Π΅ просто Π½ΠΎΠΌΠ΅Ρ€ΠΎΠΌ, Π° Π² Π²ΠΈΠ΄Π΅ Π½Π°Π±ΠΎΡ€Π° синусов ΠΈ косинусов Ρ€Π°Π·Π½Ρ‹Ρ… частот (Π€ΡƒΡ€ΡŒΠ΅β€‘ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²), Ρ‡Ρ‚ΠΎΠ±Ρ‹ модСль ΠΌΠΎΠ³Π»Π° Π»ΡƒΡ‡ΡˆΠ΅ ΡƒΠ»Π°Π²Π»ΠΈΠ²Π°Ρ‚ΡŒ пСриодичСскиС ΠΈ дальниС зависимости Π² тСкстС ΠΈ ΠΎΠ±ΠΎΠ±Ρ‰Π°Ρ‚ΡŒ Π½Π° Π΄Π»ΠΈΠ½Ρ‹ контСкста, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ½Π° Π½Π΅ Π²ΠΈΠ΄Π΅Π»Π° Π½Π° ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. Intern-S1-Pro ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ Tool Calling Ρ‡Π΅Ρ€Π΅Π· OpenAI-совмСстимый API. Плюс, Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΅ΡΡ‚ΡŒ Ρ€Π΅ΠΆΠΈΠΌ Ρ€Π°Π·ΠΌΡ‹ΡˆΠ»Π΅Π½ΠΈΡ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π²ΠΊΠ»ΡŽΡ‡Π΅Π½ ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ, Π½ΠΎ Ссли Π½ΡƒΠΆΠ½Π° ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ, Π° Π½Π΅ Π³Π»ΡƒΠ±ΠΈΠ½Π° - ΠΎΠ½ ΠΎΡ‚ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ. Π”Π΅ΠΏΠ»ΠΎΠΉ поддСрТиваСтся LMDeploy, vLLM ΠΈ SGLang. ⚠️ Если ΠΏΠ»Π°Π½ΠΈΡ€ΡƒΠ΅Ρ‚Π΅ Ρ€Π°ΡΠΊΠ°Ρ‚Π°Ρ‚ΡŒ модСль Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΈΠ·-Π·Π° Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… рядов, Π½Π΅ ΡΠΏΠ΅ΡˆΠΈΡ‚Π΅ - оптимизация модуля всС Π΅Ρ‰Π΅ продолТаСтся. πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅: Apache 2.0 License. 🟑МодСль 🟑Demo πŸŸ‘Π‘ΠΎΠΎΠ±Ρ‰Π΅ΡΡ‚Π²ΠΎ Π² Discord πŸ–₯GitHub @ai_machinelearning_big_data #AI#ML#LLM#InternS1Pro#ShanghaiAI