← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #8266

@ai_machinelearning_big_data

Machinelearning

ΠŸΡ€ΠΎΡΠΌΠΎΡ‚Ρ€Ρ‹31,100ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ просмотров
ΠžΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½14 Π°Π²Π³.14.08.2025, 09:04
Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅ поста

Π‘ΠΎΠ΄Π΅Ρ€ΠΆΠΈΠΌΠΎΠ΅

πŸ“ŒTencent Yan: созданиС AAA-ΠΈΠ³Ρ€ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π΄ΠΈΡ„Ρ„ΡƒΠ·ΠΈΠΎΠ½Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Команда Yan ΠΈΠ· Tencent анонсировала ΠΎΠ΄Π½ΠΎΠΈΠΌΠ΅Π½Π½Ρ‹ΠΉ Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ для ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎΠΉ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ Π²ΠΈΠ΄Π΅ΠΎ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ, ΠΏΠΎ сути, являСтся Ρ„ΡƒΠ½Π΄Π°ΠΌΠ΅Π½Ρ‚ΠΎΠΌ для создания Ρ†Π΅Π»Ρ‹Ρ… Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΈΡ€ΠΎΠ² Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Yan ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΠ΅Ρ‚ 3 модуля: ΡΠΈΠΌΡƒΠ»ΡΡ†ΠΈΡŽ уровня AAA-ΠΈΠ³Ρ€, ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠΌΠΎΠ΄Π°Π»ΡŒΠ½ΡƒΡŽ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΡŽ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Π° ΠΈ Π΅Π³ΠΎ Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π½Π° Π»Π΅Ρ‚Ρƒ. πŸŸ‘ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ β€” Yan-Sim. Он ΠΎΡ‚Π²Π΅Ρ‡Π°Π΅Ρ‚ Π·Π° ΡΠΈΠΌΡƒΠ»ΡΡ†ΠΈΡŽ с рСалистичной Ρ„ΠΈΠ·ΠΈΠΊΠΎΠΉ ΠΈ Ρ€Π΅Π½Π΄Π΅Ρ€ΠΈΠ½Π³ΠΎΠΌ Π² Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΈ 1080p ΠΏΡ€ΠΈ 60 ΠΊΠ°Π΄Ρ€Π°Ρ… Π² сСкунду. Π’ основС Π»Π΅ΠΆΠΈΡ‚ Stable Diffusion, Π½ΠΎ с рядом ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΉ. Π’ΠΎ-ΠΏΠ΅Ρ€Π²Ρ‹Ρ…, Π±Ρ‹Π» Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½ VAE с высокой ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒΡŽ сТатия ΠΈ Π½ΠΈΠ·ΠΊΠΎΠΉ Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΎΠΉ. Он ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π΅Ρ‚ пространствСнноС сТатиС с 8 Π΄ΠΎ 32 Ρ€Π°Π· ΠΈ добавляСт Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ΅ сТатиС Π² 2 Ρ€Π°Π·Π°, обрабатывая ΠΊΠ°Π΄Ρ€Ρ‹ ΠΏΠ°Ρ€Π°ΠΌΠΈ. Π’ΠΎ-Π²Ρ‚ΠΎΡ€Ρ‹Ρ…, для самого процСсса Π΄ΠΈΡ„Ρ„ΡƒΠ·ΠΈΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΊΠ°ΡƒΠ·Π°Π»ΡŒΠ½ΠΎΠ΅ Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠ΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ позволяСт Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π²ΠΈΠ΄Π΅ΠΎ ΠΊΠ°Π΄Ρ€ Π·Π° ΠΊΠ°Π΄Ρ€ΠΎΠΌ. НаконСц, для ускорСния инфСрСнса примСняСтся Ρ†Π΅Π»Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Ρ‚Π΅Ρ…Π½ΠΈΠΊ: сокращСниС шагов ΡˆΡƒΠΌΠΎΠΏΠΎΠ΄Π°Π²Π»Π΅Π½ΠΈΡ Π΄ΠΎ 4 с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ DDIM-сэмплСра, ΠΊΠΎΠ½Π²Π΅ΠΉΠ΅Ρ€ ΡˆΡƒΠΌΠΎΠΏΠΎΠ΄Π°Π²Π»Π΅Π½ΠΈΡ со ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠΌ ΠΎΠΊΠ½ΠΎΠΌ, KV-ΠΊΡΡˆΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅, структурный ΠΏΡ€ΡƒΠ½ΠΈΠ½Π³ UNet ΠΈ ΠΊΠ²Π°Π½Ρ‚ΠΎΠ²Π°Π½ΠΈΠ΅ вСсов Π΄ΠΎ FP8. Π’ ΠΈΡ‚ΠΎΠ³Π΅ Yan-Sim выполняСт Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΡŽ бСсконСчного ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎΠ³ΠΎ Π²ΠΈΠ΄Π΅ΠΎ с Π½ΠΈΠ·ΠΊΠΎΠΉ Π·Π°Π΄Π΅Ρ€ΠΆΠΊΠΎΠΉ (0.07с), Ρ‡Ρ‚ΠΎ сопоставимо с Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌ Π³Π΅ΠΉΠΌΠΏΠ»Π΅Π΅ΠΌ. πŸŸ‘Π’Ρ‚ΠΎΡ€ΠΎΠΉ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ - Yan-Gen. Π’ Π½Π΅ΠΌ происходит ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠΌΠΎΠ΄Π°Π»ΡŒΠ½Π°Ρ гСнСрация ΠΌΠΈΡ€ΠΎΠ² ΠΏΠΎ тСкстовым ΠΈ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΌ ΠΏΡ€ΠΎΠΌΠΏΡ‚Π°ΠΌ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π΄Π²ΡƒΡ…ΡƒΡ€ΠΎΠ²Π½Π΅Π²ΠΎΠΉ систСмы иСрархичСских описаний. Π“Π»ΠΎΠ±Π°Π»ΡŒΠ½ΠΎΠ΅ описаниС опрСдСляСт статичный ΠΌΠΈΡ€: Ρ‚ΠΎΠΏΠΎΠ»ΠΎΠ³ΠΈΡŽ, Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΉ ΡΡ‚ΠΈΠ»ΡŒ ΠΈ освСщСниС, выполняя Ρ€ΠΎΠ»ΡŒ "якоря" для всСй Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ. Π›ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹Π΅ описания, Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅ΠΌΡ‹Π΅ для ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΡ… Π²ΠΈΠ΄Π΅ΠΎΠΊΠ»ΠΈΠΏΠΎΠ², ΠΎΡ‚Π²Π΅Ρ‡Π°ΡŽΡ‚ Π·Π° динамичСскиС события ΠΈ взаимодСйствия. Π­Ρ‚ΠΎΡ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ позволяСт ΠΌΠΎΠ΄Π΅Π»ΠΈ ΡΠΌΠ΅ΡˆΠΈΠ²Π°Ρ‚ΡŒ стили ΠΈ ΠΌΠ΅Ρ…Π°Π½ΠΈΠΊΠΈ ΠΈΠ· Ρ€Π°Π·Π½Ρ‹Ρ… Π΄ΠΎΠΌΠ΅Π½ΠΎΠ². НапримСр, ΠΌΠΎΠΆΠ½ΠΎ Π·Π°Π΄Π°Ρ‚ΡŒ ΡΡ‚ΠΈΠ»ΡŒ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ³Ρ€Ρ‹, Π° ΠΌΠ΅Ρ…Π°Π½ΠΈΠΊΡƒ - ΠΎΡ‚ Π΄Ρ€ΡƒΠ³ΠΎΠΉ. Π§Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΠ±ΠΈΡ‚ΡŒΡΡ интСрактивности Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ, готовая модСль ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ Ρ‡Π΅Ρ€Π΅Π· Π΄ΠΈΡΡ‚ΠΈΠ»Π»ΡΡ†ΠΈΡŽ, Π² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ‡Π΅Π³ΠΎ получаСтся эффСктивный Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€, Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‰ΠΈΠΉ Π² нСсколько шагов ΠΈ Π²Ρ‹Π΄Π°ΡŽΡ‰ΠΈΠΉ 12-17 FPS Π½Π° ΠΎΠ΄Π½ΠΎΠΉ NVIDIA H20 ΠΈΠ»ΠΈ Π΄ΠΎ 30 FPS Π½Π° Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅Ρ…. πŸŸ‘Π’Ρ€Π΅Ρ‚ΠΈΠΉ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ - Yan-Edit. Π­Ρ‚ΠΎ Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€ сгСнСрированного ΠΌΠΈΡ€Π° прямо Π²ΠΎ врСмя взаимодСйствия с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ тСкстовых ΠΊΠΎΠΌΠ°Π½Π΄. ΠšΠ»ΡŽΡ‡Π΅Π²Π°Ρ идСя здСсь - Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ симуляции ΠΌΠ΅Ρ…Π°Π½ΠΈΠΊΠΈ ΠΈ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ Ρ€Π΅Π½Π΄Π΅Ρ€ΠΈΠ½Π³Π°. Бимулятор ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎΠΉ ΠΌΠ΅Ρ…Π°Π½ΠΈΠΊΠΈ, построСнный Π½Π° Π±Π°Π·Π΅ Yan-Sim, Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ с ΠΊΠ°Ρ€Ρ‚Π°ΠΌΠΈ Π³Π»ΡƒΠ±ΠΈΠ½Ρ‹, сохраняя 3D-структуру ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Π½ΠΎ отбрасывая ΠΈΡ… Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠ΅ ΠΎΡ„ΠΎΡ€ΠΌΠ»Π΅Π½ΠΈΠ΅. Π­Ρ‚ΠΎ позволяСт Π΅ΠΌΡƒ ΠΈΠ·ΡƒΡ‡Π°Ρ‚ΡŒ ΠΎΠ±Ρ‰ΠΈΠ΅ Π·Π°ΠΊΠΎΠ½Ρ‹ взаимодСйствия, зависящиС ΠΎΡ‚ Ρ„ΠΎΡ€ΠΌΡ‹, Π° Π½Π΅ ΠΎΡ‚ Ρ†Π²Π΅Ρ‚Π° ΠΈΠ»ΠΈ тСкстуры. Π’ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹ΠΉ Ρ€Π΅Π½Π΄Π΅Ρ€Π΅Ρ€, основанный Π½Π° Yan-Gen ΠΈ ControlNet, ΠΎΡ‚Π²Π΅Ρ‡Π°Π΅Ρ‚ Π·Π° Ρ€Π°ΡΠΊΡ€Π°ΡˆΠΈΠ²Π°Π½ΠΈΠ΅ этих ΠΊΠ°Ρ€Ρ‚ Π³Π»ΡƒΠ±ΠΈΠ½Ρ‹ Π² соотвСтствии со стилСвыми ΠΏΡ€ΠΎΠΌΠΏΡ‚Π°ΠΌΠΈ. ΠŸΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ Π² любой ΠΌΠΎΠΌΠ΅Π½Ρ‚ ввСсти Π΄Π²Π° Ρ‚ΠΈΠΏΠ° ΠΊΠΎΠΌΠ°Π½Π΄: структурныС (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, "Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚") ΠΈ стилСвыС (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, "ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Ρ†Π²Π΅Ρ‚ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°"). Пока ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Π² самом Π½Π°Ρ‡Π°Π»Π΅ своСго ΠΏΡƒΡ‚ΠΈ - ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½Ρ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π΄Π΅ΠΌΠΎ-Π²ΠΈΠ΄Π΅ΠΎ ΠΈ тСхничСский ΠΎΡ‚Ρ‡Π΅Ρ‚, ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‰ΠΈΠΉ созданиС Yan. ΠœΠΎΠ΄ΡƒΠ»ΠΈ систСмы, Π² Π²ΠΈΠ΄Π΅ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠΎΠ±Π΅Ρ‰Π°ΡŽΡ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Ρ‚ΡŒ Π² блиТайшСС врСмя. @ai_machinelearning_big_data #news#ai#ml