TGTGInsightаналитика telegramLIVE / telegram public index
← НЕЙРОГРАМОТНОСТЬ
НЕЙРОГРАМОТНОСТЬ avatar

TGINSIGHT POST

Post #1506

@edu4telegram

НЕЙРОГРАМОТНОСТЬ

Просмотры4,630Количество просмотров
Опубликован28 мая28.05.2025, 10:57
Содержимое поста

Содержимое

👀Нейросеть, которая смотрит по-новому Cовременный подход к компьютерному зрению, который делает нейросети еще более мощными и универсальными — Vision Transformer. Разберем поэтапно, как это работает: 1️⃣Разделение на кусочки: изображение разбивается на маленькие квадратики (патчи), как если бы вы нарезали фотографию на кусочки. 2️⃣Преобразование: каждый кусочек превращается в набор чисел (вектор). 3️⃣Обработка трансформером: эти векторы поступают в трансформер — специальный блок, который учится находить важные связи между разными частями картинки. 4️⃣Результат: на выходе получается ответ — например, что на картинке изображено. Где используется ViT? 🖼 Google использует такие трансформеры для улучшения поиска по картинкам; 💊 В медицине ViT помогает врачам быстрее и точнее ставить диагнозы по снимкам; 🔎 На заводах это помогает автоматически находить бракованные детали на конвейере. А в чем фишка? ViT часто работает не хуже (а иногда и лучше!) классических CNN (нажмите здесь, чтобы вспомнить что это). Особенно это помогает, когда данных для обучения очень много. Трансформеры проще масштабируются и могут «замечать» более сложные связи внутри изображения. Стало понятнее, что это? ❤️ — да! 🔥 — ну почти 🦄 — ничего непонятно, но очень интересно #теория@EDU4Telegrambot