TGINSIGHT CHAT
DeepSchool
@deep_school
ОбразованиеЭто канал школы deepschool.ru. Здесь мы будем: - напоминать вам теорию ML/DL в виде коротких постов, - задавать вопросы с собеседований, - рассказывать про полезные фреймворки - и делиться советами, которые помогут вам в работе. @deepschool_support
Последние посты
Стр. 17 из 45 · 530 постов
Опубликован 17 сент.
Дистилляция диффузии. Часть 2 Сейчас диффузионные модели — лидеры по качеству и разнообразию генерации. Однако чаще всего они требуют большого количества шагов, что делает генерацию довольно медленной, например, в сравнении с GANs. Именно поэтому ускорение диффузионных моделей является важной задачей. Существует множество различных подходов для превращения 1000-шаговой диффузии в генератор, состоящий из нескольких шагов. Недавно мы познакомились с понятием дистилляции диффузии и рассмотрели первые попытки её применения для ускорения. Однако эти работы не смогли добиться нужного качества и требовали значительных улучшений. Сегодня мы рассмотрим несколько SOTA-работ, которые, в частности, использовались для ускорения известной SDXL Turbo. Познакомимся с основными методами и узнаем: - что представляет собой Adversarial дистилляция с использованием GANs - чем отличается Latent Adversarial Diffusion Distillation (LADD) от Adversarial Diffusion Distillation (ADD) - и что такое Distribution Matching Distillation (DMD) Читайте новую статью по ссылке: https://deepschool-pro.notion.site/2-fa4241bac68749beafffa7ddffda41a0?pvs=4
Опубликован 15 сент.
Учим беспилотную машину видеть В мире 3D Computer Vision одна из основных задач — это ориентация роботов в пространстве. Это позволяет автоматизировать множество повседневных процессов от беспилотных такси до доставки еды. Для решения этой задачи требуется работа с различными сенсорами, понимание алгоритмов 3D-реконструкции и SLAM. Всё это мы разберём на бесплатном мастер-классе, где научим беспилотную машину ориентироваться в пространстве. Каждая лекция сопровождается домашним заданием для того, чтобы опробовать новые навыки на практике. Мастер-класс будет состоять из трёх лекций, они пройдут 17, 18 и 20 сентября (вт, ср и пт). На лекциях вы: — научитесь восстанавливать 3D-сцену по данным с камеры и лидара — узнаете, как ориентировать робота в пространстве — освоите симулятор Carla для синтеза данных — поймёте теорию, стоящую за SLAM-алгоритмами А также мы представим программу курса 3DCV и подарим скидки!🔥 🔔 Первая лекция пройдёт 17 сентября в 19:00 МСК. Изучайте подробнее программу мастер-класса и регистрируйтесь по ссылке!
Опубликован 12 сент.
Сопоставляем изображения с помощью ключевых точек Поиск ключевых точек и сопоставление изображений — это начальный этап перехода от 2D задач к 3D. Сопоставив между собой множество изображений сцены, мы сможем восстановить трёхмерную структуру объектов в ней. Но для этого важно иметь «хорошие» ключевые точки. В новой статье мы расскажем: - что значит «хорошие» ключевые точки - как работают классические алгоритмы на примере SiFT - и какие есть нейросетевые подходы разной степени мощности и сложности Читайте нашу статью по ссылке: https://deepschool-pro.notion.site/96ea7f72daa64c948baeec3b4ccc72f1?pvs=4
Опубликован 6 сент.
Дистилляция диффузии. Часть 1 Диффузионные модели очень круто генерируют изображения, но в «ванильном» исполнении они очень медленные. Поэтому нужны методы их ускорения. Недавно мы разобрали один из них — InstaFlow. Сегодня мы рассмотрим ещё один вид ускорения — дистилляцию. Это процесс, при котором мы передаём знания от нашей большой модели-учителя к более быстрой модели-ученику. В этой статье мы узнаем: - что представляет собой дистилляция диффузионной модели - каким образом проходит процесс progressive-дистилляции - и как можно дистиллировать conditional модели Читайте новую статью по ссылке: https://deepschool-pro.notion.site/1-917a8a82ad2e450980a1ddb630b62956?pvs=4
Опубликован 3 сент.
Последний онлайн-поток курса 3D CV В начале октября стартует 4 поток курса по 3D CV. Это программа, на которой вы на практике научитесь решать 3D задачи: — сегментировать лидарные облака — писать SLAM алгоритмы — строить 3D-модели объектов — создавать аватаров — синтезировать данные в Blender — обучать NeRF, 3D Gaussian Splatting и другое 🔥 Это будет последний поток в формате онлайн-лекций в Zoom, где вы можете задавать вопросы спикерам по ходу лекции и общаться в конце в кулуарах. В конце этой недели мы проведём закрытую презентацию курса для участников листа ожидания — представим программу, ответим на ваши вопросы и подарим скидки. Запишитесь, чтобы раньше всех узнать о программе, успеть занять место и получить самые выгодные условия!🔥 Записаться в лист ожидания
Опубликован 2 сент.
Сделай сам Мы подготовили подборку полезных каналов на YouTube, где есть реализации архитектур с нуля, и, конечно, поделились ссылками на их примеры. Она поможет вам: - детальнее погрузиться в тему архитектуры трансформеров для разных задач, именно этой архитектуре посвящена большая часть видео в нашей подборке - попробовать применить трансформеры на практике для различных задач - самостоятельно создать нужную для вас архитектуру с нуля с помощью представленных туториалов Читайте новый пост по ссылке: https://deepschool-pro.notion.site/b1f197579cf648baa81c34a6005ad379?pvs=4
Опубликован 27 авг.
LLM — Sold Out! Места на первый поток курса Large Language Models закончились! Поздравляем всех, кто успел присоединиться! 3 сентября встретимся на лекции «Введение в задачи NLP»🎓 Если вы не успели попасть в этот раз, не переживайте! Запишитесь в лист ожидания, чтобы первыми узнать о старте нового потока и получить самую большую скидку! Записаться в лист ожидания
Опубликован 26 авг.
Адаптируем Visual-Language модель для детекции аномалий Детекция аномалий на медицинских изображениях — задача, требующая высокой точности и гибкости за счёт разнообразных форматов данных и типов патологий. Сегодня мы рассмотрим решение, которое использует необычную адаптацию модели CLIP под новый домен и задачу. А также узнаем: - что такое «аномалия» и какие они бывают - как обучить универсальный детектор аномалий для работы с различными модальностями и анатомическими областями - и можно ли обобщить подход на немедицинские изображения Читайте нашу статью по ссылке: https://deepschool-pro.notion.site/Visual-Language-d3c607cc974942a78f60ed418147a1dd?pvs=4
Опубликован 23 авг.
Как обучать, деплоитьи ускорять LLM Вчера провели открытую лекцию, на которой рассказали про LLM в реальных задачах. А также представили курс «Large Language Models»🍾 На программе вы освоите полный цикл внедрения LLM: от выбора модели и промптинга до RAG, Fine-tuning и деплоя. В рамках обучения вы освоите теорию и научитесь: 🔹 дообучать LLM на собственных данных 🔹 строить LLM-системы и приложения 🔹 выводить проекты в продакшен 🔹 ускорять инференс и обучение 🔹 использовать трюки для повышения метрик Курс подойдёт и тем, кто только погружается в сферу LLM, и тем, кто уже в ней работает✨ Вы попадёте в команду опытных инженеров, с каждым из которых можно пообщаться лично. Программа состоит из 14 лекций, продолжительность — 16 недель. 📆 Старт — 3 сентября. ⚠️Предупреждаем, что осталось 4 из 50 мест. Поэтому успевайте присоединиться! UPD: места на этот поток закончились, но вы можете записаться в лист ожидания на следующий! Мы сообщим о старте. 🎁 До 29 августа вы можете записаться со скидкой 5%. Читайте подробнее о программе, спикерах, тарифах на сайте и присоединяйтесь со скидкой! До встречи на курсе!👍
Опубликован 22 авг.
LLM в реальных задачах Сейчас часто встречаются вакансии с упоминанием LLM: — Проекты на ранних стадиях ищут инженеров, которые понимают, как работают LLM, могут собрать RAG «на коленке», интегрировать это в систему и проверить работоспособность. — Более…
Опубликован 22 авг.
LLM в реальных задачах Сейчас часто встречаются вакансии с упоминанием LLM: — Проекты на ранних стадиях ищут инженеров, которые понимают, как работают LLM, могут собрать RAG «на коленке», интегрировать это в систему и проверить работоспособность. — Более…
Опубликован 21 авг.
Visual Large Language Models Когда OpenAI открыли API к своим моделям, многие NLP-инженеры начали переживать насчёт своей карьеры: зачем нужны будут дорогостоящие инженеры, когда можно по API за пару центов сходить в модель куда сильнее, чем та, что у нас в проде. Время прошло, все поняли, что ходить по API не так уж и дёшево, моделям надо как-то добавлять знания через тюнинг, промпт-инжиниринг, RAG и так далее. Но теперь модели хорошо справляются и с CV-задачами. Ждут ли CV-инженеров те же переживания?🤔 Чтобы ответить на этот вопрос, надо для начала познакомиться с тем, что вообще из себя представляют эти модели. Для этого мы и подготовили новую статью. В ней мы обсудим: - основные детали архитектур мультимодальных моделей - какие выделяют этапы обучения в разных подходах - какие существуют способы оценки, их проблемы и решения - что такое rl и промптинг - интересные приёмы и как их можно применять в своих задачах Читайте статью по ссылке И подписывайтесь на DeepSchool