TGTGInsightаналитика telegramLIVE / telegram public index
← THINGS PROGRAMMERS DO
THINGS PROGRAMMERS DO avatar

TGINSIGHT POST

Post #6433

@thingsprogrammersdo

THINGS PROGRAMMERS DO

Просмотры6,580Количество просмотров
Опубликован17 нояб.17.11.2025, 09:56
Содержимое поста

Содержимое

Когда рекомендательная система смотрит только на ваши лайки — страдает весь фид. VK перекрутил свой стек и внедрил мультимодальные модели, которые читают смысл контента: что в видео происходит, какая там эмоция, кто в кадре и почему это может понравиться пользователю. Кросс-форматная модель объединяет изображение, звук, текст и обложку в единое пространство. Мультимодальная языковая модель объясняет сюжет и даже «понимает», на каких сценах вы задержались дольше. Плюс работает распознавание популярных персон — потому что пользователи чаще смотрят то, что связано с любимыми героями. Это не «угадайка по лайкам», а полноценный анализ медиаконтента, который делает рекомендации точнее.