TGTGInsightтелеграм анализLIVE / telegram public index
Обратно към каналите
DLStories avatar

TGINSIGHT CHAT

DLStories

@DL_Stories

Образование

Что-то про AI Research и AI образование от Танечки Сотрудничество/предложения: @atmyre

Абонати1.6万Текущи абонати
Публикации826Индексирани публикации
Скорошен обхват122,590Прегледи на скорошни публикации
Последни публикации

Последни публикации

Таг: #learning · 62 публикации

当前筛选 #learning清除筛选

Отзыв на книгу "Machine Learning System Design" #learning Не так давно Валерий Бабушкин и Арсений Кравченко написали свою книгу о дизайне ML систем. Она выпускается частями, сейчас вышло около половины. Мне досталась копия книги бесплатно взамен на отзыв (чему я очень была рада, хе-хе). Книгу я, наконец, прочитала (ту ее часть, что уже вышла), и в этом посте пишу свой отзыв. Для начала пару слов, что такое ML system design: Простыми словами, ML system design — это искусство построения системы с ML-компонентами. Например, пусть вы — онлайн-магазин, и хотите внедрить в свой магазин умный поиск по товарам на основе ML-модели. Чтобы это сделать, вам нужно разработать эффективный дизайн системы поиска, отвечающий вашим требованиям, реализовать эту систему и научиться ее эффективно поддерживать в условиях постоянно меняющегося мира. Вот это все входит в ML system design. Еще важно сказать, что дизайн нужен не только большим и высоконагруженным системам. Даже небольшие пайплайны с небольшим потоком данных нуждаются в качественном проектировании. Теперь, почему мне хотелось прочитать эту книгу: В апреле 2022 года я собеседовалась в DeepMind на позицию ML Engineer. Прошла все этапы до последнего интервью, которое как раз было на ML System Design. Я его завалила (и по своим ощущениям, и по фидбеку). Но сама не могла понять, что в моем мыслительном процессе было не так. Отчасти из-за этого опыта мне и было интересно прочитать эту книгу. Начав читать, я через страниц 15 поняла, что я делала не так. Я задавала не те вопросы. Я вообще их мало задавала, хотя в дизайне ML систем вопросы — это чуть ли не самое главное. Итак, перейдем к книге. О чем книга и для кого она: "Machine Learning System Design" — это отличная вводная книга в мир построения ML-систем. Другими словами, если вы интересуетесь ML System Design или строите свою первую систему и думаете, с чего начать, то эта книга — ровно то, что вам нужно. В ней очень хорошо разобраны базовые вопросы ML дизайна: - Что вообще такое этот ваш ML System Design; - На что обязательно нужно обратить внимание при планировании и построении системы; - Какие вопросы задавать и какие стратегии использовать, чтобы наилучшим образом задизайнить систему; - Важные моменты в каждом из шагов построения и поддержки системы, от первого черновика дизайна до внедрения и поддержки. То есть, книга высокоуровневая. Она научит вас правильно мыслить, задавать правильные вопросы. А за конкретными инструментами дальше пойдете в другие места. Написано все понятным и приятным языком. Читать не скучно и не сложно. Практически к каждой ключевой мысли есть пример из опыта работы авторов: они отлично иллюстрируют важность той или иной компоненты дизайна системы. Короче, книга хороша, рекомендую. (тут, на всякий случай, небольшой дисклеймер: чтобы начать изучать ML System Design, нужно хорошо понимать основы ML и принципы работы ML-пайплайнов. Сначала — основы, потом – дизайн систем) 📘Купить книжку туть (разумеется, по мере выхода глав вы будете получать к ним доступ)

9,680 views

Hashtags

В конце июня в Ванкувере была конференция CVPR (на которую у меня был билет, но я не поехала, потому что Канада не выдала визу в срок😒) CVPR — самая масштабная конференция по computer vision, на которой много воркшопов и туториалов. Воркшоп — это раздел конференции, где собраны доклады вокруг конкретной темы. Например, event-based vision или Vision-Centric Autonomous Driving. Это часто либо более обзорные доклады, чем те, что на основной конференции, либо вообще work in progress — доклады об исследованиях, которые еще не закончены, и в которых еще не получены явные результаты. Туториал — это также раздел с докладами на определенную тему, но они более вводные и более глубокие, дающие представление о конкретном разделе исследования. То есть, такой мини-курс. Часто еще на туториалах бывает интерактив (практика). И вот вам списки туториалов и воркшопов с CVPR-2023: - Воркшопы; - Туториалы. Видео многих из них к этому моменту уже выложены в открытый доступ, а некоторые будут выложены в ближайшее время. Конкретно я буду смотреть туториал Recent Advances in Vision Foundation Models #learning

10,100 views

Hashtags

Всем привет! В последнее время я была очень занята, но обычные посты в канале возобновятся совсем скоро. А пока вот вам пара образовательных апдейтов: #learning 1️⃣ Лаида (наша верховная Техножрица) завершила цикл постов на тему "как вкатиться в ML с нуля за ноль рублей". В ее презентациях — пошаговый план изучения области со ссылками на курсы/книги. Всего три части: - Часть 1: предварительные знания; - Часть 2: ML/DL (что такое и как/где учить); - Часть3: вспомогательные инструменты и поиск работы; Если у вас есть знакомые, кто хочет перейти в ML, будет хорошей идеей отправить им эти презентации. Возможно, кого-то спасет от покупки дорогих курсов, обещающих "дойти до middle ML engineer и зп в 200k за 3 месяца" 2️⃣ Мои друзья из Mathshub запускают бесплатный интенсив по развитию soft skills для IT специалистов. Интенсив ориентирован на тех, кто стал или собирается стать руководителем в команде (даже если только в будущем). Старт 8 августа, длительность три недели. Больше информации об интенсиве тут. А если вдруг я пропустила что-то классное в образовательной сфере за последние недели, делитесь в комментариях =)

10,800 views

Hashtags

Если уж и проходить курс по промпт-инженирингу ChatGPT, то только такой: Курс ChatGPT Prompt Engineering for Developersот DeepLearning.Ai в коллаборации с OpenAI. Преподаватели — сам Эндрю Ын и Isa Fulford (Member of Technical Staff, OpenAI). #learning Это небольшой (9 занятий) курс о том, как эффективно общаться с ChatGPT так, чтобы получить максимально точный, полный и удобный (в нужном формате) ответ на ваш запрос. Курс практический: каждое занятие — скринкаст jupyter notebook с кодом составления промпта, запроса к API и получения результата. Рядом со скринкастом открывается интерактивный jupyter, где вы сами можете запускать код занатия и изменять его. Пока что курс бесплатный. Пишут, что станет платным, когда обучающая платформа DeepLearning.AI выйдет из beta. Когда это произойдет, я не знаю. Я курс еще не проходила, но Юра Кашницкий (автор New Yorko Times) уже прошел и поделился тем, что в курсе хорошо, а чего не хватило. Но даже если в курсе чего-то не хватает, у курса есть community, где с другими участниками можно обсуждать темы промпт-инжениринга. Ссылка на комьюнити появится в списке уроков после записи на курс. Имхо если комьюнити будет живое, то это будет просто кладезь постоянно обновляющейся инфы про работу с ChatGPT. Ссылка на курс

11,400 views

Hashtags

Ну вот, как и писала в посте выше, начинают появляться все больше "вводных" курсов по AI. В частности, по так хайпующему сейчас Generative AI. #learning Очередной лот — курс Generative AI with Large Language Models от DeepLearning.ai и Amazon AWS. С первого взгляда контент курса выглядит хорошо. Обещают: - погружение в LLM: что это, как работает, какие архитектуры бывают - дообучение LLM (alignment, human feedback, RLHF, трюки вроде chain-of-thoughts, etc) - практическое руководство по выбору LLM для своей задачи и дообучению на AWS; - оптимизация обучения (скейлинг на GPU, LORA, Parameter efficient fine-tuning, etc) Полный syllabus тут. Если кто-то будет смотреть, скажите потом, как оно

8,470 views

Hashtags

Пара образовательных апдейтов: #learning 1. Все доклады с DataFest смонтировали и собрали в одно место. Вот тут можно найти треки по разным тематикам, внутри треков — видео. Напомню, что я выступала в треке Instruct Models: там были доклады по RLHF, Instruction tuning (это мой), создание своей LLM'ки на практике и еще пара других. Если что, я перезаписала видео для выкладки, тех технических неполадок там не будет) 2. HuggingFace выпускают новый курс по работе с аудио. Курс будет тут, как обычно бесплатно. Уже есть структура первых модулей. Записаться на курс можно в формочке тут. Еще напомню, что у HuggingFace есть и другие курсы: - Deep RL Course - NLP Course - Diffusion Models Course

8,890 views

Hashtags

Гугл сделал прикольную штуку: Generative AI Learning Path. Это Tl;Dr из 10 мини-уроков о том, как работают современные генеративные модели в CV и NLP. Начинают с того, что вообще такое — эти ваши "большие языковые модели", переходят к общим описаниям архитектур и аттэншену, заканчивают туториалом о том, как самому создать и задеплоить такую модель (на Google Cloud, разумеется, хехе) Кажется, может быть полезно тем, кто в DL понимает не особо, но хочет базово разобраться в том, на каких принципах работают совеременные модели и задеплоить свою. 📄Ссылка #learning

10,800 views

Hashtags

Записали подкаст с Ольгой. Вышло очень классно, мне было оочень интересно! Как смонтируется запись, выложу ее везде и напишу об этом. В конце Ольга упомянула, что в AIRI открылся прием заявок на летнюю школу по AI. Школа будет 17-30 июля в Татарстане. В программе — лекции, семинары и практика. Среди преподавателей — Евгений Бурнаев, Дмитрий Ветров, Александр Панов и другие. Направления: – RL (обучение с подкреплением) – робототехника – 3D компьютерное зрение – генеративное и вероятностное моделирование – моделирование данных на многообразиях машинного обучения – графовые нейронные сети – детектирование и диагностика аномалий по сенсорным данным Школа бесплатная. Подробная информация и подача заявки на сайте. (подача до 4 июня) P.S. Лекции прошлогодней школы AIRI выложены на YouTube #learning

8,880 views

Hashtags

А у меня анонс: в четверг, 25 мая, в 18:00 МСК на YouTube-канале DLSchool будет живая лекция про беспилотные автомобили от Александра Петюшко. Вход свободный, во время лекции можно и нужно будет задавать вопросы. Запись будет. #learning Более подробно о лекции и спикере: Тема встречи: Введение в технический стек беспилотных автомобилей. Открытые проблемы и вызовы. Начнем рассказ с того, как устроены современные беспилотники с технической точки зрения. Затем перейдем к проблемам и вызовам, которые сейчас остро стоят в беспилотниках. Особенно подробно обсудим проблемы в поведенческой части технологии. А еще затронем тему регулирования беспилотных автомобилей в мире: насколько регуляция вредит или помогает разработке. Обсуждение будет построено на основе материалов открытых лекций, которые Александр читал в университете Беркли. О спикере: Александр Петюшко (Google Scholar) — технический руководитель направления Исследования Поведения в Nuro. Nuro — это компания-разработчик беспилотных автомобилей из Калифорнии. До Nuro Александр работал ведущим инженером и научным экспертом в Huawei, а также управляющим директором и ведущим научным сотрудником в AIRI. Кроме этого, Александр читает лекции по теории глубокого обучения в МГУ и МФТИ. А еще он был гостем подкаста Deep Learning Stories аж два раза: в первый раз мы говорили с ним о собеседованиях в AI Research, а во второй — о математике в deep learning. Приходите! Будет интересно) (В день лекции еще напомню о ней тут)

10,600 views

Hashtags

О чем этот канал и что тут есть Всем привет! За последний год канал сильно вырос, а я как-то даже и не писала за это время о том, кто я, что это за канал и что тут есть. Исправляюсь! Кто я: Меня зовут Таня, я — единственный автор этого канала. Сейчас я PhD студент в Queen Mary University of London, исследую foundation модели computer vision. Как только из моей научки выйдет что-то хорошее, обязательно поделюсь с вами) До PhD я работала AI рисерчером в Philips и Huawei. А еще я преподаю глубокое обучение и computer vision. Например, я один из создателей и преподавателей Deep Learning School — это бесплатная школа глубокого обучения при МФТИ. Мы проводим наборы каждый семестр, а все наши лекции и семинары лежат в открытом достпе на YouTube-канале. Подробнее о школе можно почитать тут. Кроме этого, мы с командой DLS также записали бесплатный курс по основам машинного обучения. Подробнее о курсе тут. О чем канал: В канале я в основном разбираю интересные научные статьи по разным темам AI. Стараюсь разбирать как можно более полно и понятно, выделяя суть. Разборы можно найти по хэштегу #paper. Некоторые из них получаются слишком длинными, и я пишу их в Teletype. Кроме разборов тут бывают ссылки на обучающие материалы (хэштег #learning), а также рассуждения на разные темы вокруг AI (хэштег #ai_inside). В целом, пишу о том, что меня интересует в данный момент. Также на канале бывает реклама, она помечена хэштегом "промо". Реклама помогает мне не упасть в социальную яму как PhD студенту, а также добавляет мотивации делать разборы статей. Стараюсь делать рекламу нечасто. Что еще есть полезного: У меня есть подкаст Deep Learning Stories, куда я приглашаю разных людей из мира AI поговорить за разные темы. Сейчас в подкасте 7 выпусков. Среди них о том, как проходить собеседования в AI research, нужна ли математика в AI и какая, как там с AI в медицине, квантовой физике и сейсмологии, и просто рассуждения вокруг рисерча с крутыми гостями. Подкаст можно найти тут: - Yandex Music - Apple Music - Google Music - Spotify - YouTube Еще у меня есть две большие статьи на Хабре: - Что такое inductive bias и где он есть в нейросетях; - Структурное мышление, или важное отличие человека от ИИ Вот так. Вроде бы, ничего не забыла. В общем, welcome новым читаталям! И большое спасибо тем, кто читает канал уже давно 💜 Если есть вопросы, прошу в комментарии) Поддержать канал (скинуться мне на кофеек, который я оочень люблю) можно тут: - рублями (Тинькофф) - любая другая валюта (Revolut)

14,100 views

На канале Тани Шавриной нашла ссылку на шпаргалку по языковым моделям. #learning Их в последнее время, кажется, столько разных развелось, что я уже потеряла надежду в них разобраться, и даже с этим смирилась. В принципе, не страшно, я в первую очередь не NLP занимаюсь) Но если хотите разобраться вы, или хотя бы понять на высоком уровне, как шел прогресс и какие ветви есть, то гайд будет полезен. К гайду прилагается статья-обзор "Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond" А еще в гайде есть инструкция по выбору модели для своего NLP-проекта. 📄Шпаргалка

10,000 views

Hashtags

Вот вам кое-что очень крутое: подробный гайд от Meta AI по self-supervised learning (SSL). #learning Это даже не просто гайд, а целая мини-книга (cookbook, как называют авторы). В ней: - Что такое SSL и чем хорош подход; - Как SSL придумали и как он развивался; - Обзоры основных подходов SSL; - Трюки, как лучше всего обучать SSL-модельки. В разделе про трюки, кстати, рассказывают про обновление весов сети-учителя в подходе teacher-student с помощью moving average. Этим же способом обучается сеть-учитель в DINO, разбор которого я писала в посте выше. В разборе я написала, что этот трюк сейчас используется много где, но я не знаю, почему он такой успешный. А вот, в гайде от Meta как раз про это есть! (раздел 3.4.1) В книге делается упор на SSL в картинках (computer vision), но в последнем разделе также немного говорится про использование SSL в других доменах. Вообще, Meta AI в последнее время публикует слишком много хороших работ в computer vision. Одни SAM и DINO-v2 уже многого стоят. Кажется, они решили стать а-ля OpenAI в visual домене. А SSL — это один из многообещающих подходов к построению действительно мощных моделей, потому что он не требует разметки данных, и при этом позволяет научить модели очень много "понимать" о данных. Сами Meta в своем анонсе книги назвали SSL "темной материей интеллекта", и "ключевых ингридиентом недавних прорывов". Что ж, вот я и нашла, что читать завтра в самолете =) Ссылки: 📘The self-supervised learning cookbook Инфу о книге нашла тут А если не понимаете, что такое SSL и нужна ли вам книга, прочитайте сначала этот краткий ликбез по SSL

8,870 views

Hashtags

123•••56
ПредишнаСтр. 1 от 6Следваща