TGTGInsightаналитика telegramLIVE / telegram public index
← DeepSchool
DeepSchool avatar

TGINSIGHT POST

Post #570

@deep_school

DeepSchool

Просмотры7,280Количество просмотров
Опубликован13 авг.13.08.2025, 12:20
Содержимое поста

Содержимое

VLM для детекции объектов на изображении У традиционных детекторов есть серьёзное ограничение: набор классов определён обучающей выборкой (Closed-set Object Detection). В попытках обойти его, создали новый класс детекторов, Open Vocabulary Object Detection (OVOD), для детекции произвольных объектов. В новой статье мы привели обзор таких OVOD-моделей, основанных на Vision Language Model (VLM). Из статьи вы узнаете: - какие есть подходы для применения VLM к задаче Object Detection - какие результаты сравнения моделей на бенчмарках для Closed-Set и Open Vocabulary детекций - почему идеи CLIP всё ещё актуальны Читайте новую статью по ссылке!