← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #9354

@ai_machinelearning_big_data

Machinelearning

ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€Ρ‹38,400ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ просмотров
ΠžΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½3 янв.03.01.2026, 09:15
Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅ поста

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅

🌟 IQuest-Coder-V1: китайская модСль, которая обошла Π»ΠΈΠ΄Π΅Ρ€ΠΎΠ² Π² ΠΊΠΎΠ΄ΠΈΠ½Π³Π΅. Quest Research, поддСрТанная Ρ„ΠΎΠ½Π΄ΠΎΠΌ Ubiquant, прСдставила 40-ΠΌΠΈΠ»Π»ΠΈΠ°Ρ€Π΄Π½ΡƒΡŽ модСль c контСкстным ΠΎΠΊΠ½ΠΎΠΌ Π² 128K Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ², которая, со слов Π°Π²Ρ‚ΠΎΡ€ΠΎΠ², Π²Ρ‹Π±ΠΈΠ²Π°Π΅Ρ‚ 81,4% Π½Π° SWE-Bench Verified, 49,9% Π½Π° BigCodeBench ΠΈ 81,1% Π½Π° LiveCodeBench v6. Π­Ρ‚ΠΎ прСвосходит ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ Claude Sonnet 4.5 ΠΈ GPT-5.1, нСсмотря Π½Π° Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ мСньшСС количСство ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ². МодСль ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ‚Π΅Ρ…Π½ΠΈΠΊΡƒ "code-flow" β€” ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π½Π° ΡΠ²ΠΎΠ»ΡŽΡ†ΠΈΠΈ Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠ΅Π² ΠΈ ΠΊΠΎΠΌΠΌΠΈΡ‚Π°Ρ…, ΠΈ Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Π° Π½Π° 2 Π²Π΅Ρ‚ΠΊΠΈ: 🟠Dense Models : Base ΠΈ Instruct вСрсии для дообучСния ΠΈ слСдованию инструкциям 🟒Loop Models: оптимизированная вСрсия с максимальной ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒΡŽ ΠΏΠΎ VRAM (int4 ΠΌΠΎΠΆΠ΅Ρ‚ Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒΡΡ Π½Π° 3090\4090) АрхитСктура LoopCoder ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ†ΠΈΠΊΠ»ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΊΠΎΠ½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡŽ трансформСра, Π³Π΄Π΅ ΠΎΠ΄Π½ΠΈ ΠΈ Ρ‚Π΅ ΠΆΠ΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π² 2-Ρ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π°Ρ… ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…. На ΠΏΠ΅Ρ€Π²ΠΎΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π΅ модСль ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π΅Ρ‚ эмбСддинги Ρ‡Π΅Ρ€Π΅Π· свои слои с ΡƒΡ‡Π΅Ρ‚ΠΎΠΌ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΉ слов. На Π²Ρ‚ΠΎΡ€ΠΎΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π΅ модСль ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Π΄Π²Π° Ρ‚ΠΈΠΏΠ° внимания: глобальноС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ обращаСтся ΠΊΠΎ всСй ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π° для понимания ΠΎΠ±Ρ‰Π΅Π³ΠΎ контСкста, ΠΈ локальноС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ смотрит Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π° ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠ΅ слова Π²ΠΎ Π²Ρ‚ΠΎΡ€ΠΎΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π΅ для сохранСния ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ тСкста. Оба Ρ‚ΠΈΠΏΠ° внимания ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‚ΡΡ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠ°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ€Π΅ΡˆΠ°Π΅Ρ‚, сколько вСса Π΄Π°Ρ‚ΡŒ Π³Π»ΠΎΠ±Π°Π»ΡŒΠ½ΠΎΠΌΡƒ контСксту, Π° сколько локальной ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Π’ Ρ‚Π΅Ρ…ΠΎΡ‚Ρ‡Π΅Ρ‚Π΅ заявлСны Π΅Ρ‰Π΅ 7B ΠΈ 14B вСрсии, Π½ΠΎ сроки ΠΈΡ… ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ нСизвСстны. πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅: Modified MIT License πŸŸ‘Π‘Ρ‚Ρ€Π°Π½ΠΈΡ†Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° πŸŸ‘Π’Π΅Ρ…ΠΎΡ‚Ρ‡Π΅Ρ‚ πŸŸ‘ΠΠ°Π±ΠΎΡ€ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ πŸ–₯GitHub @ai_machinelearning_big_data #AI#ML#LLM#IQuest#QuestResearch