TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
🏄 Соревновательный Data Science | Kaggle | Чемпионаты avatar

TGINSIGHT CHAT

🏄 Соревновательный Data Science | Kaggle | Чемпионаты

@data_science_winners

Образование

Соревновательный Data Science - сообщество тех, кто побеждает или только учится побеждать в ML чемпионатах👨‍💻 Наш курс на Stepik: https://stepik.org/a/108888 Чат: https://t.me/+UeIeCRykqYEwY2Y6 Для предложений и вопросов: @Aleron_1

Подписчики3,260Текущее число подписчиков
Постов686Проиндексировано постов
Охват31,890Просмотры последних постов
Последние посты

Последние посты

Стр. 7 из 58 · 686 постов

Опубликован 15 авг.

Привет, нейрокодеры!🧠 Сегодня в курсе по LLM открылся БОНУСный модуль с новыми материалами и задачами. На этом большой апдейт курса можно считать завершенным 🎉: - перешли на новое полнофункциональное АПИ - переработали весь легаси код - перезаписали видео - обновили и добавили много нового материала Structured Output LangGraph и мультиагенты Tools Calling LLM-Ops Теперь курс называется Делаем свой AI - продукт на базе LLM 2.0❗️ До конца недели 🥶 замораживаем прежнюю цену на курс. Для тех кто ещё не успел присоединиться, напоминаем про промокод DATAFEELING. Вчера число учащихся на курсе перевалило за 1400 человек. 🔥 P.S.: Завтра объявим новый конкурс с призами по бонусным задачам.

2,240 views

Опубликован 12 авг.

Привет, Чемпионы! 🏆 Kaggle запустил свою арену для LLM. Где они будут сражаться друг с другом в простых играх. Сегодня сразу после презентации GPT5, пройдет финал по шахматам - можно смотреть в YouTube, начиная с 20:30. В финале o3 от Самы и Grok4 от Илона.…

2,180 views

Опубликован 7 авг.

Привет, Чемпионы! 🏆 Kaggle запустил свою арену для LLM. Где они будут сражаться друг с другом в простых играх. Сегодня сразу после презентации GPT5, пройдет финал по шахматам - можно смотреть в YouTube, начиная с 20:30. В финале o3 от Самы и Grok4 от Илона. Чья возьмёт??

2,950 views

Опубликован 6 авг.

Одев голубой профиль ex-CEO Kaggle запустил от имени OpenAI новый хакатон с призовыми в $500,000. Порисечить предлагается вредоносное поведение gpt-oss-20. Тут.

2,670 views

Опубликован 27 июл.

Привет, чемпионы!🏆 На этой неделе Kaggle выкатил сразу 2 новых соревы, NLP и временные ряды - обе отлично подойдут для вкатывания в соревновательный DS! 1️⃣Jigsaw - Agile Community Rules Classification - надо создать ПИЛУ🪚 бинарный классификатор, который определяет выходит ли комментарий за "рамки приличия" - нарушает правила сообщества или нет. 3 месяца впереди. Метрика: Mean columnAUC. Данных всего 2 Мб. Выглядит, как сорева с низким порогом входа для новичков. 2️⃣MITSUI&CO. Commodity Prediction Challenge - классика временных рядов - предсказываем финансовые рынки - причём все сразу 🤯. 2 месяца делаем решения, потом до Нового года ждём итоговый ЛБ на реальных данных 🎄! Из необычного - 15 денежных призовых мест, призовой фонд 100К$➕Хитрая необычная метрика Данных тоже немного, всего 23 Мб. Как думаете, стоит сразу заходить или подождать месяцок пока все баги найдут и устранят?

3,180 views

Опубликован 26 июл.

Меняем правила игры в AI: обходим классические бенчмарки и ищем лучшие модели Недавно работая над проектом чат-бота, моя команда студентов начала с классических бенчмарков - GLUE, SQuAD и прочих. На стандартных тестах всё выглядело круто, но в реальных условиях всё было не так радужно. Пришлось менять подход. Вместо того чтобы гнаться за лидербордами, ребята начали комбинировать разные метрики. И тут их ждал сюрприз! Модели вроде DistilBERT и ALBERT реально выстрелили, особенно в понимании контекста и генерации ответов. Вдохновленные этим, мы решили узнать, как другие ребята в AI выбирают свои модели. Запустили опрос среди ML-инженеров, дата-сайентистов, продактов и MLOps. Оказалось, что многие используют кастомные метрики, такие как F1-score и BLEU, что дало нам кучу идей для улучшения. Так что, ребята, не бойтесь отходить от стандартов и учиться у сообщества. Это может привести к классным решениям! ➡️ Если есть желание внести вклад, то пройдите опрос и поделитесь своим опытом (7 минут): 👉https://forms.gle/dDWeWaWbxhk6qsNL7 Репост = карма👼

4,100 views

Опубликован 12 июл.

Привет, чемпионы!🏆 Сегодня посмотрим, что сейчас можно порешать на Kaggle из NLP-сорев 🔡. 1️⃣Make Data Count - Finding Data References - соревнование на text mining. Ищем в текстах ссылки на статьи, датасеты и пр. Идёт уже месяц, но ещё 2 месяца впереди - самое время заходить, за месяц обнаружили кучу косяков в данных, в частности, криво размеченный трейн, - многое уже поправили, но стоит внимательно почитать дискашены. Уже успели поменять метрику и пересчитать ЛБ 🤯. Данных 2 гига, ПДФки - можно прокачать скилл работы с PDF-файлами, актуальная тема. 2️⃣MAP - Charting Student Math Misunderstandings - очередная сорева от The Learning Agency Lab стартовала 2 дня назад 🆕. Предлагается создать решение, которое будет определять понимание студентами математических концепций 😱. Из необычного - в трейне всего 8 Мб. Напишите, что сейчас решаете и какие успехи!

2,720 views

Опубликован 8 июл.

Привет, Чемпионы!🏆 Пока все спали, Kaggle совершил революцию в системе подсчёта рейтингов, которую почти не трогали с момента запуска платформы. 🤯 Что изменилось?🧐 - Убрали титулы и рейтинг за дискашены (давно напрашивалось) - Слили вместе титулы Novice и Contributor - В подсчете голосов для получения медалей за ноутбуки и датасеты, теперь учитываются апвоуты только от уровня Expert и выше - Форки ноутбуков теперь засчитываются как апвоуты (тоже давно напрашивалось) - Появились 2х, 3х Грандмастера, чтобы поддерживать мотивацию среди топов - Появилась отдельная вкладка Progression в профиле, где показывается текущий прогресс, сколько осталось до следующего уровня и строятся графики прогресса во времени. - Если уже получали достижение по старым правилам, а при пересчёте на новые не дотягиваете - получите титул Legacy Master или Expert. Это из основного, подробнее читайте пост. Так что бежим проверять свои личные профили 🏄 P.S. Как вам такие реформы?

2,700 views

Опубликован 7 июл.

В Сан-Франциско «королём хакатонов» признали вайбкодера, который вообще не умеет писать код. Парень выиграл более чем в 200 соревнованиях за два года, побеждая чаще любого реального разработчика. Он создаёт проекты через ChatGPT и открыто говорит в победных речах: «Я не написал ни строчки кода». Теперь он не только востребованный внештатный сотрудник, но и проводит свои мастер-классы по работе с ИИ.

2,330 views

Опубликован 3 июл.

Напоминаем про завтрашний СТРИМ по случаю обновления LLM курса! ⏰В 17-00, на этом канале. 💥 Расскажем, про текущие и будущие обновления, пообщаемся на около LLM темы, разыграем мерч курса среди зрителей. Из новостей: уже обновили первые 3 модуля - зацените! P/S:🎁 Специальный приз разыграем среди тех, кто оставит под этим постом слово "Приду" и действительно придёт на СТРИМ!

2,260 views

Опубликован 1 июл.

📕 🔥 Прикол: На Reddit все прутся от крутого учебника по алгоритмам! Это просто офигенная книга на 680 страниц, которую сделал один чувак-энтузиаст. И она не просто книга, а целая интерактивная штука! Что там есть? 22 жирные главы: Там реально всё — от простых штуковин вроде массивов до сложных алгоритмов для графиков. 300 интерактивных картинок: Чтобы все концепции были максимально понятны, всё показывают наглядно. 250 кусочков кода: К каждому коду есть понятная инструкция, как что решать. Прямо внутри есть Python-штука: Можно менять код и запускать его, чтобы сразу практиковаться. Это не просто электронная книжка, а целое приложение с живыми страничками, которые можно трогать и с ними взаимодействовать. Работает на компах с MacOS 11+ и Windows 10+. Учебник стоит $35, но автор даёт промокод SIDEPRJ на скидку 20% и студентам тоже есть скидки. А ещё, одну главу можно почитать бесплатно! Если ты учишься программировать — тут.

2,780 views

Опубликован 1 июл.

[UPD!] Приват открыт! Их стало трое, третий за 17 мин до конца отправил золотой саб.🔥 Вот это выдержка и уверенность в своей валидации, чтобы ни разу не проверить за 3 месяца и отправить сабмишен за 17 минут до конца. 🚽 Теперь ждём и читаем райтапы.

1,780 views
12•••5678910•••15•••20•••25•••30•••35•••40•••45•••50•••55•••5758