✔️Подборка полезных бесплатных курсов и гайдов на выходные.
🖥 Microsoft представила свежий цикл лекций по Python и и ИИ.
• Содержание:Курс включает 9 лекций, дополненных видео, подробными презентациями и примерами кода. Цикла - обучение разработке ИИ-агентов доступен написан понятно, даже для новичков в программирование.
• Темы: В лекциях рассматриваются такие темы, такие как RAG (Retrieval-Augmented Generation), эмбеддинги, агенты и протокол MCP.
👉Курс
💡Гарвардский курс по машинному обучению
Культовый трек CS 249 превратили в интерактивный учебник - и это, пожалуй, один из лучших стартов для инженеров, которые хотят делать реальные ML-системы, а не просто играться с моделями.
• Вся база по ML: объясняют фундамент с нуля, нужно только знание Python
• Проектирование систем и инженерия данных
• Подготовка датасетов, MLOps и мониторинг
• Развёртывание ИИ в IoT и продакшене
Это практический курс: не о формулах, а о том, как внедрять ML так, чтобы он приносил бизнесу прибыль.
Если хочешь понять, как модели живут в проде - идеальный вариант для старта.
👉Курс
🖥Создай своего Bash-агента с NVIDIA Nemotron за 1 час
NVIDIA показала, как собрать AI-агента, который понимает твои запросы на естественном языке и сам выполняет команды Bash.
В основе модель Nemotron Nano 9B v2: компактная, быстрая, идеально подходит для локального эксперимента.
Агент умеет:
- распознавать команды на естественном языке («создай папку», «покажи файлы»),
- превращать эти команды в рабочие Bash-срипты
- спрашивать подтверждение перед выполнением.
Весь код занимает ~200 строк Python, работает через FastAPI и LangGraph.
Можно расширить под DevOps, Git-операции, анализ логов или управление сервером.
👉Гайд
⚡️Kaggle Learn: интерактивные мини-курсы по Python, Data Science и машинному обучению.
Полностью бесплатно и максимально практично.
Что внутри:
• Python, Pandas, визуализация
• Основы машинного обучения и фичеринжиниринг
• Подготовка данных и работа с моделями
Практика без лишней теории учишься и сразу применяешь.
👉Курс
🖥Гайд по шардингу баз данных от PlanetScale
Вы узнаете, как масштабировать базы данных через шардинг - разбиение данных по серверам для роста производительности и отказоустойчивости.
Главное:
• Шардинг нужен, когда одна база больше не справляется с нагрузкой.
• Есть два популярных подхода — по диапазону (range) и по хешу (hash).
• Важно выбрать стабильный ключ (например, user_id) и избегать кросс-шардовых запросов.
• Прокси-слой немного увеличивает задержку, но даёт масштабируемость.
Отличный материал, если хочешь понять, как строят системы уровня YouTube. А здесь много базы по SQL
Читать
🧠60 готовых проектов по генеративному ИИ
Список из 60 проектов на GitHub с открытым кодом по генеративному ИИ 0от текстовых моделей до аудио и видео.
Каждый проект - с описанием и ссылкой на репозиторий. Можно выбрать идею, запустить локально и собрать своё AI-портфолио.
👉Github
👉Еще больше полезного.
@ai_machinelearning_big_data
#AI#MachineLearning#DataScience#ML#ИИ#freecourses
✅ Через неделю
Яндекс изнутри: от алгоритмов до измерений
📅 1–3 марта / 19:00–22:00 (время МСК) / онлайн
💵 Бесплатно
📝 Регистрация тут: https://goo.gl/rmKFd4
Пришло время рассказать о последних интересных разработках. Мы поговорим про новое поколение алгоритмов ближайших соседей, как в Алисе решается проблема оскорбительности, о гибридной системе машинного перевода, которая сочетает в себе сильные стороны нейросетевого и статистического подходов. А также — об исследованиях, современных математических методах и онлайн экспериментах, применяемых в оценке системы поиска.
🔗 Программа: https://goo.gl/wou6ek
#machinelearning#МашинноеОбучение#DataScience#online#онлайн
Иногда появляется ощущение, что жизнь вокруг ИИ происходит в режиме быстрой перемотки. Меньше месяца назад Мета выпустила SAM для сегментации любых объектов на изображении, но такое ощущение, что это было всегда. Только за последние 2 дня я уже прочитал около десятка документов, описывающих прототипы использования SAM для изучения недр.
Например, на первых двух картинках (из этого поста) - берем шлиф(срез породы) -> пропускаем через SAM -> выделяем все зерна пород -> автоматически получаем распределение размера зерен (гранулометрия).
На последней картинке я просто кликнул мышкой и выделил все пыльцевые зерна на изображении полученном с помощью электронного микроскопа. Автоматически выделенные зерна можно классифицировать и использовать палеотнологами для определения геологического возраста породы.
#machinelearning#Geo
🔥 Сегодня
AI.Hack Санкт-Петербург
📅 9–11 марта / 19:00–22:00 (время МСК) / Санкт-Петербург, Виленский пер., дом 14
💵 Бесплатно
📝 Регистрация тут: https://goo.gl/AgRbiu
AI.Hack — это 48 часов на проверку гипотез в Machine Learning и Data Science, это обратная связь и поддержка опытных экспертов, контакты ведущих AI фондов: Flint Capital и другие известные стартапы.
Призовой фонд хакатона: 600 000 руб.
График проведения:
До 7-го марта. Сбор заявок на участие в хакатоне
7 марта. Онлайн митап по генерации идей
9 марта. Старт хакатона
11 марта. Финал хакатона
#MachineLearning#МашинноеОбучение#DataScience#hackathon#хакатон#СанктПетербург
🔥 Сегодня
AI.Hack Санкт-Петербург
📅 9–11 марта / 19:00–22:00 (время МСК) / Санкт-Петербург, Виленский пер., дом 14
💵 Бесплатно
📝 Регистрация тут: https://goo.gl/AgRbiu
AI.Hack — это 48 часов на проверку гипотез в Machine Learning и Data Science, это обратная связь и поддержка опытных экспертов, контакты ведущих AI фондов: Flint Capital и другие известные стартапы.
Призовой фонд хакатона: 600 000 руб.
График проведения:
До 7-го марта. Сбор заявок на участие в хакатоне
7 марта. Онлайн митап по генерации идей
9 марта. Старт хакатона
11 марта. Финал хакатона
#MachineLearning#МашинноеОбучение#DataScience#hackathon#хакатон#СанктПетербург
🔥 Сегодня
AI.Hack Санкт-Петербург
📅 9–11 марта / 19:00–22:00 (время МСК) / Санкт-Петербург, Виленский пер., дом 14
💵 Бесплатно
📝 Регистрация тут: https://goo.gl/AgRbiu
AI.Hack — это 48 часов на проверку гипотез в Machine Learning и Data Science, это обратная связь и поддержка опытных экспертов, контакты ведущих AI фондов: Flint Capital и другие известные стартапы.
Призовой фонд хакатона: 600 000 руб.
График проведения:
До 7-го марта. Сбор заявок на участие в хакатоне
7 марта. Онлайн митап по генерации идей
9 марта. Старт хакатона
11 марта. Финал хакатона
#MachineLearning#МашинноеОбучение#DataScience#hackathon#хакатон#СанктПетербург
✅ Завтра
AI.Hack Санкт-Петербург
📅 9–11 марта / 19:00–22:00 (время МСК) / Санкт-Петербург, Виленский пер., дом 14
💵 Бесплатно
📝 Регистрация тут: https://goo.gl/AgRbiu
AI.Hack — это 48 часов на проверку гипотез в Machine Learning и Data Science, это обратная связь и поддержка опытных экспертов, контакты ведущих AI фондов: Flint Capital и другие известные стартапы.
Призовой фонд хакатона: 600 000 руб.
График проведения:
До 7-го марта. Сбор заявок на участие в хакатоне
7 марта. Онлайн митап по генерации идей
9 марта. Старт хакатона
11 марта. Финал хакатона
#MachineLearning#МашинноеОбучение#DataScience#hackathon#хакатон#СанктПетербург
#ИИ поручения.
На сайте Кремля опубликовано поручение Правительству при участии РАН, РГО, Российского исторического общества представить предложения по обучению больших моделей с использованием данных о российских культуре, истории, результатах отечественных научных исследований.
Срок – 15 июня 2026.
ИИ Google использует научные данные, собранные через Google Scholar. Статьи российских авторов в этой системе находятся, это по точным и естественным наукам, по гуманитарным и экономике – выборочно, тенденциозно.
На картинках от ИИ Сбера, который не доучился на отечественных данных:
Лимнологический институт в Иркутске. На Байкале!
Томский государственный университет. А похож!
Сибирский федеральный университет. Горы потрясли!
Институты в новосибирском Академгородке. Футуризм!
Polymathic - междисциплинарный ИИ
Ох, какая классная межуниверситетская инициатива - Polymathic🔥.
Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п.
В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков.
На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI.
#AI#ML
Иногда появляется ощущение, что жизнь вокруг ИИ происходит в режиме быстрой перемотки. Меньше месяца назад Мета выпустила SAM для сегментации любых объектов на изображении, но такое ощущение, что это было всегда. Только за последние 2 дня я уже прочитал около десятка документов, описывающих прототипы использования SAM для изучения недр.
Например, на первых двух картинках (из этого поста) - берем шлиф(срез породы) -> пропускаем через SAM -> выделяем все зерна пород -> автоматически получаем распределение размера зерен (гранулометрия).
На последней картинке я просто кликнул мышкой и выделил все пыльцевые зерна на изображении полученном с помощью электронного микроскопа. Автоматически выделенные зерна можно классифицировать и использовать палеотнологами для определения геологического возраста породы.
#machinelearning#Geo
⚡️ В сеть утекли «мозги» ChatGPT-5. Что внутри?
Наткнулся на GitHub-репозиторий, где якобы сливаютсистемные инструкции для топовых нейронок. Это такие базовые правила, которые регламентируют работу ИИ и задают им «рамки». Нейронка «собери сам», как из ИКЕА 😁
Даже если и фейк, уж больно похоже на правду и круто объясняет их поведение, можно брать за пример себе. Покопался в свежем файле «думающей» модели ChatGPT-5 thinking. Вот 5 интересных находок:
1️⃣Запрет на ожидание
Модели запрещено говорить «подождите, я думаю» или «пару минут, вернусь». Плюс она должна дать ответ мгновенно, если информация «есть сразу» — это явно нужно для экономии ресурсов. Зачем тратить ресурсы на «размышления», если ответ уже имеется?
2️⃣Приказ быть человечной
По умолчанию — быть «естественной и игривой», а не роботом. Эмодзи, сленг, даже небрежная пунктуация — всё это прописано в правилах, чтобы мимикрировать под живой разговор. И ваше «будь человечнее» только усиляет эту инструкцию, т.к. базово она уже есть. Ну и да, «думающие» модели всегда кажутся менее человечными, и новая ChatGPT 5, увы — не исключение.
3️⃣Параноидальная математика
Любую арифметику, даже 2+2, модель обязана вычислять «цифра за цифрой». Это, по сути, прямое признание, что с простыми расчетами у ИИ до сих пор проблемы.
4️⃣Цифровое досье на вас
У модели есть раздел с «Биографией пользователя», куда она тихонько записывает факты о вас для персонализации. Перед ответом она «тихо думает», как это использовать.
Это одна из важных «удерживающих» фичей ChatGPT в целом, крутая!С подпиской помнит больше, конечно* 🐸
*Говорят о «бесконечной памяти», но мы же не верим, правда? Речь явно о большом объеме и периодической оптимизации.
5️⃣Агрессивный поиск и пруфы
Сомневаешься — гугли. Это правило. Любой факт из сети должен подкрепляться ссылкой (это уже must-have рынка, раньше так умел только perplexity). По сути, радикальный метод борьбы с «галлюцинациями», который помог, судя по бенчмаркам.
______________________________
В итоге, вся эта «магия» и «человечность» ИИ — по сути, просто очень детальная должностная инструкция. Никакого чуда, просто крутой промпт-инжиниринг😎
А вас какой пункт удивил больше всего?
В репозитории есть и старые, и новые модели. И Gemini, и Perplexity, и Grok, и Claude...Изучать с осторожностью!
#ИИ