← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #8608

@ai_machinelearning_big_data

Machinelearning

ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€Ρ‹29,300ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ просмотров
ΠžΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½22 сСнт.22.09.2025, 15:35
Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅ поста

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅

πŸš€ Новая китайская модСль LongCat-Flash-Thinking 🧠 Π­Ρ‚ΠΎ модСль для рассуТдСний, которая ΠΏΠΎΠΊΠ°Π·Π°Π»Π° SOTA-Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ срСди open-source Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. ⚑ ОсновноС: - АрхитСктура MoE, 560B ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², ΠΈΠ· Π½ΠΈΡ… 27B Π°ΠΊΡ‚ΠΈΠ²ΠΈΡ€ΡƒΡŽΡ‚ΡΡ. - Π­Ρ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ: Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π½Π° **64,5% мСньшС Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ²**( Ρ‡Π΅ΠΌ Π΄Ρ€ΡƒΠ³ΠΈΠΌ ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌ модСлям Ρ‚ΠΎΠ³ΠΎ ΠΆΠ΅ класса), Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ Ρ‚ΠΎΠΏ-Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π½Π° AIME25 (с Π½Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΌ использованиСм инструмСнтов,). - ΠšΠΎΠ½Ρ‚Π΅ΠΊΡΡ‚: 128k, ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с усилСниСм Π½Π° Π·Π°Π΄Π°Ρ‡Π°Ρ… рассуТдСний ΠΈ ΠΊΠΎΠ΄Π°, многоэтапноС пост-Ρ‚ΡŽΠ½ΠΈΠ½Π³ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠ°Π³Π΅Π½Ρ‚Π½Ρ‹ΠΌ синтСзом. - Π˜Π½Ρ„Ρ€Π°ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π°: асинхронный RL Π΄Π°Ρ‘Ρ‚ 3x ускорСниС ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с синхронными Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠ°ΠΌΠΈ. βš™οΈ ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ для ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ΅Π½Π°: - Π‘Π²ΠΎΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ ядра для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с MoE ΠΈ ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΡ‘ΠΌΡ‹ распрСдСлённого обучСния, - KV-cache reduction, ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅, chunked prefill, - статичСская/эластичная ΠΌΠ°Ρ€ΡˆΡ€ΡƒΡ‚ΠΈΠ·Π°Ρ†ΠΈΡ, peer-to-peer cache transfer, heavy-hitter replication ΠΈ PD-disaggregation. - ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° SGLang ΠΈ vLLM для эффСктивного дСплоя. πŸ“Š Π‘Π΅Π½Ρ‡ΠΌΠ°Ρ€ΠΊΠΈ: - Π›ΠΈΠ΄ΠΈΡ€ΡƒΠ΅Ρ‚ Π² tool use (**τ²-Bench, VitaBench**) - Π₯ΠΎΡ€ΠΎΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΏΠΎ instruction following (**IFEval, COLLIE, Meeseeks-zh**). ΠšΠΈΡ‚Π°ΠΉΡ†Ρ‹ ΡΡ‚Π°Π±ΠΈΠ»ΡŒΠ½ΠΎ ΡƒΠ΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‚ лидСрство Π² reasoning-модСлях. 🟠HF: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking @ai_machinelearning_big_data #AI#LLM#Reasoning#MoE#DeepLearning#OpenSource