← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #8062

@ai_machinelearning_big_data

Machinelearning

ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€Ρ‹24,200ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ просмотров
ΠžΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½15 июл.15.07.2025, 09:01
Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅ поста

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅

🌟MUVERA: ΡƒΡ€Π°Π²Π½ΠΈΠ²Π°Π΅ΠΌ Π² скорости ΠΌΠ½ΠΎΠ³ΠΎΠ²Π΅ΠΊΡ‚ΠΎΡ€Π½Ρ‹ΠΉ ΠΈ ΠΎΠ΄Π½ΠΎΠ²Π΅ΠΊΡ‚ΠΎΡ€Π½Ρ‹ΠΉ поиск. MUVERA - Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½Ρ‹ΠΉ Google Research, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ сводит ΡΠ»ΠΎΠΆΠ½ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ ΠΌΠ½ΠΎΠ³ΠΎΠ²Π΅ΠΊΡ‚ΠΎΡ€Π½ΠΎΠ³ΠΎ поиска ΠΎΠ±Ρ€Π°Ρ‚Π½ΠΎ ΠΊ простому ΠΈ быстрому MIPS, ΠΊΠ°ΠΊ Π² ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π°Ρ… с ΠΎΠ΄Π½ΠΈΠΌ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠΌ. Π‘ΡƒΡ‚ΡŒ проста: вмСсто Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π³Ρ€ΠΎΠΌΠΎΠ·Π΄ΠΊΠΈΠΌ Π½Π°Π±ΠΎΡ€ΠΎΠΌ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ², MUVERA сТимаСт Π΅Π³ΠΎ Π² Π΅Π΄ΠΈΠ½Ρ‹ΠΉ Π²Π΅ΠΊΡ‚ΠΎΡ€ фиксированной Π΄Π»ΠΈΠ½Ρ‹, Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΉ Fixed Dimensional Encoding (FDE). Π“Π»Π°Π²Π½Ρ‹ΠΉ Ρ‚Ρ€ΡŽΠΊ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ скалярноС ΠΏΡ€ΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΠ΅ этих Π½ΠΎΠ²Ρ‹Ρ… FDE-Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΎΡ‡Π΅Π½ΡŒ Ρ‚ΠΎΡ‡Π½ΠΎ аппроксимируСт ΠΈΡΡ…ΠΎΠ΄Π½ΡƒΡŽ, Β«Ρ‡Π΅ΡΡ‚Π½ΡƒΡŽΒ» ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΡƒ Π§Π°ΠΌΡ„Π΅Ρ€Π°. На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ процСсс выглядит ΠΊΠ°ΠΊ двухэтапный ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€. Π‘Π½Π°Ρ‡Π°Π»Π° MUVERA Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ FDE для всСх Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² Π² Π±Π°Π·Π΅ ΠΈ индСксируСт ΠΈΡ… с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠ³ΠΎ MIPS-солвСра. Когда ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ запрос, для Π½Π΅Π³ΠΎ Ρ‚ΠΎΠΆΠ΅ создаСтся FDE, ΠΈ систСма молниСносно Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ нСбольшой список ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ². А ΡƒΠΆΠ΅ Π·Π°Ρ‚Π΅ΠΌ этот ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΠΉ список пСрСранТируСтся с использованиСм ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠΉ, ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎΠΉ, Π½ΠΎ Ρ‚ΠΎΡ‡Π½ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ Π§Π°ΠΌΡ„Π΅Ρ€Π°. На Π²Ρ‹Ρ…ΠΎΠ΄Π΅ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ ΠΈ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ, ΠΈ качСство. Π’ практичСском сравнСнии с ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΠΌ SOTA ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ PLAID, MUVERA ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π² срСднСм Π½Π° 10% Π±ΠΎΠ»Π΅Π΅ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΠΏΠΎΠ»Π½ΠΎΡ‚Ρƒ Π²Ρ‹Π΄Π°Ρ‡ΠΈ ΠΏΡ€ΠΈ сокращСнии Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΈ Π½Π° 90%. Π§Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ Ρ‚ΠΎΠ³ΠΎ ΠΆΠ΅ качСства, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡƒ трСбуСтся ΠΎΡ‚ΠΎΠ±Ρ€Π°Ρ‚ΡŒ Π² 5-20 Ρ€Π°Π· мСньшС ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ² для Ρ„ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ пСрСранТирования. Π‘ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΠ³ΠΎ, эти FDE-Π²Π΅ΠΊΡ‚ΠΎΡ€Ρ‹ ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ ΡΠΆΠΈΠΌΠ°ΡŽΡ‚ΡΡ β€” Π΄ΠΎ 32 Ρ€Π°Π· с минимальной ΠΏΠΎΡ‚Π΅Ρ€Π΅ΠΉ качСства. Для Ρ‚Π΅Ρ…. ΠΊΡ‚ΠΎ Ρ…ΠΎΡ‡Π΅Ρ‚ ΠΏΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ, Π² Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Π½Π° Github Π΅ΡΡ‚ΡŒ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ MUVERA Π½Π° Python ΠΈ C++ . πŸ“ŒΠ›ΠΈΡ†Π΅Π½Π·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅: Apache 2.0 πŸŸ‘Π‘Ρ‚Π°Ρ‚ΡŒΡ 🟑Arxiv πŸ–₯GitHub @ai_machinelearning_big_data #AI#ML#LLM#MUVERA#GoogleResearch