Π‘ΠΎΠ΄Π΅ΡΠΆΠΈΠΌΠΎΠ΅
π ΠΠΎΠ²Π°Ρ ΠΊΠΈΡΠ°ΠΉΡΠΊΠ°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ LongCat-Flash-Thinking π§ ΠΡΠΎ ΠΌΠΎΠ΄Π΅Π»Ρ Π΄Π»Ρ ΡΠ°ΡΡΡΠΆΠ΄Π΅Π½ΠΈΠΉ, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΏΠΎΠΊΠ°Π·Π°Π»Π° SOTA-ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ ΡΡΠ΅Π΄ΠΈ open-source ΡΠ΅ΡΠ΅Π½ΠΈΠΉ. β‘ ΠΡΠ½ΠΎΠ²Π½ΠΎΠ΅: - ΠΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ° MoE, 560B ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΠΎΠ², ΠΈΠ· Π½ΠΈΡ 27B Π°ΠΊΡΠΈΠ²ΠΈΡΡΡΡΡΡ. - ΠΡΡΠ΅ΠΊΡΠΈΠ²Π½ΠΎΡΡΡ: ΡΡΠ΅Π±ΡΠ΅Ρ Π½Π° **64,5% ΠΌΠ΅Π½ΡΡΠ΅ ΡΠΎΠΊΠ΅Π½ΠΎΠ²**( ΡΠ΅ΠΌ Π΄ΡΡΠ³ΠΈΠΌ ΠΎΡΠΊΡΡΡΡΠΌ ΠΌΠΎΠ΄Π΅Π»ΡΠΌ ΡΠΎΠ³ΠΎ ΠΆΠ΅ ΠΊΠ»Π°ΡΡΠ°), ΡΡΠΎΠ±Ρ Π΄ΠΎΡΡΠΈΡΡ ΡΠΎΠΏ-ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠ² Π½Π° AIME25 (Ρ Π½Π°ΡΠΈΠ²Π½ΡΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠΎΠ²,). - ΠΠΎΠ½ΡΠ΅ΠΊΡΡ: 128k, ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ Ρ ΡΡΠΈΠ»Π΅Π½ΠΈΠ΅ΠΌ Π½Π° Π·Π°Π΄Π°ΡΠ°Ρ ΡΠ°ΡΡΡΠΆΠ΄Π΅Π½ΠΈΠΉ ΠΈ ΠΊΠΎΠ΄Π°, ΠΌΠ½ΠΎΠ³ΠΎΡΡΠ°ΠΏΠ½ΠΎΠ΅ ΠΏΠΎΡΡ-ΡΡΠ½ΠΈΠ½Π³ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ Ρ ΠΌΡΠ»ΡΡΠΈΠ°Π³Π΅Π½ΡΠ½ΡΠΌ ΡΠΈΠ½ΡΠ΅Π·ΠΎΠΌ. - ΠΠ½ΡΡΠ°ΡΡΡΡΠΊΡΡΡΠ°: Π°ΡΠΈΠ½Ρ ΡΠΎΠ½Π½ΡΠΉ RL Π΄Π°ΡΡ 3x ΡΡΠΊΠΎΡΠ΅Π½ΠΈΠ΅ ΠΏΠΎ ΡΡΠ°Π²Π½Π΅Π½ΠΈΡ Ρ ΡΠΈΠ½Ρ ΡΠΎΠ½Π½ΡΠΌΠΈ ΡΡΠ΅ΠΉΠΌΠ²ΠΎΡΠΊΠ°ΠΌΠΈ. βοΈ ΠΠΏΡΠΈΠΌΠΈΠ·Π°ΡΠΈΠΈ Π΄Π»Ρ ΠΏΡΠΎΠ΄Π°ΠΊΡΠ΅Π½Π°: - Π‘Π²ΠΎΠΈ ΠΎΠΏΡΠΈΠΌΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π½ΡΠ΅ ΡΠ΄ΡΠ° Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ MoE ΠΈ ΡΠΏΠ΅ΡΠΈΠ°Π»ΡΠ½ΡΠ΅ ΠΏΡΠΈΡΠΌΡ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»ΡΠ½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ, - KV-cache reduction, ΠΊΠ²Π°Π½ΡΠΎΠ²Π°Π½ΠΈΠ΅, chunked prefill, - ΡΡΠ°ΡΠΈΡΠ΅ΡΠΊΠ°Ρ/ΡΠ»Π°ΡΡΠΈΡΠ½Π°Ρ ΠΌΠ°ΡΡΡΡΡΠΈΠ·Π°ΡΠΈΡ, peer-to-peer cache transfer, heavy-hitter replication ΠΈ PD-disaggregation. - ΠΠΎΠ΄Π΄Π΅ΡΠΆΠΊΠ° SGLang ΠΈ vLLM Π΄Π»Ρ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π½ΠΎΠ³ΠΎ Π΄Π΅ΠΏΠ»ΠΎΡ. π ΠΠ΅Π½ΡΠΌΠ°ΡΠΊΠΈ: - ΠΠΈΠ΄ΠΈΡΡΠ΅Ρ Π² tool use (**ΟΒ²-Bench, VitaBench**) - Π₯ΠΎΡΠΎΡΠΈΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ ΠΏΠΎ instruction following (**IFEval, COLLIE, Meeseeks-zh**). ΠΠΈΡΠ°ΠΉΡΡ ΡΡΠ°Π±ΠΈΠ»ΡΠ½ΠΎ ΡΠ΄Π΅ΡΠΆΠΈΠ²Π°ΡΡ Π»ΠΈΠ΄Π΅ΡΡΡΠ²ΠΎ Π² reasoning-ΠΌΠΎΠ΄Π΅Π»ΡΡ . π HF: https://huggingface.co/meituan-longcat/LongCat-Flash-Thinking @ai_machinelearning_big_data #AI#LLM#Reasoning#MoE#DeepLearning#OpenSource