TGINSIGHT CHAT
🏄 Соревновательный Data Science | Kaggle | Чемпионаты
@data_science_winners
ОбразованиеСоревновательный Data Science - сообщество тех, кто побеждает или только учится побеждать в ML чемпионатах👨💻 Наш курс на Stepik: https://stepik.org/a/108888 Чат: https://t.me/+UeIeCRykqYEwY2Y6 Для предложений и вопросов: @Aleron_1
Последние посты
Стр. 2 из 58 · 686 постов
Опубликован 7 февр.
Как агенты Санту катали решали... 🎅 (часть 1) Привет, Чемпионы! 🏆 Недавно закончился Santa 2025 на Каггле - снова решали оптимизационную задачу: надо было разложить ёлки по коробкам разных размеров без пересечений. 🌲 Долго собирался её порешать, сначала…
Опубликован 4 февр.
Как агенты Санту катали решали... 🎅 (часть 1) Привет, Чемпионы! 🏆 Недавно закончился Santa 2025 на Каггле - снова решали оптимизационную задачу: надо было разложить ёлки по коробкам разных размеров без пересечений. 🌲 Долго собирался её порешать, сначала…
Опубликован 2 февр.
🔛ЗАКРЫТЫЙ СТАРТ 🕳ПЛАТФОРМЫ АРЕНДЫ GPU ➡️37 ₽ в час Инвайт-код для подписчиков канала: ➡️DATAFEELING Действует до 15февраля, всего 50 активаций На платформе: ⭐️RTX 5090 • 32GB GDDR7 ⭐️стабильная работа без оверселлинга ⭐️живая техническая поддержка: реальные инженеры, которые помогают с настройкой и запуском 📎GPUGO.RU
Опубликован 2 февр.
Опубликован 2 февр.
Опубликован 2 февр.
Как агенты Санту катали решали...🎅 (часть 1) Привет, Чемпионы! 🏆 Недавно закончился Santa 2025 на Каггле - снова решали оптимизационную задачу: надо было разложить ёлки по коробкам разных размеров без пересечений. 🌲 Долго собирался её порешать, сначала в декабре, потом на праздниках, пока не осталось 3 дня до конца. И пришла в голову мысль, а почему бы агентов не запрячь - и задача как раз подходящая, можно 100 сабмитов в день отправлять. Давно хотел проверить, как агенты каггл решают и заодно устроить между ними соревнование - кто выше запрыгнет по итогу. Стартовые позиции: Codex 5.2 High Claude Code (Opus 4.5) Gemini (3.0 Pro, Flash) Все 3 на PRO подписках, в формате cli утилит с подключенным kaggle mcp. Сначала поштурмил с каждой, составили спеки для агентов и общий PLAN.md с банком идей. Каждый агент работал в своей папке, но они вели общую таблицу с сабмишенами и скотами, чтобы не сабмитили без улучшений. Первый день работали в трёх окнах с ручным подтверждением действий. Claude Code через полчаса залетел в серебро Дальше был план оставить их на автономную работу... Продолжение в следующих частях А пока тыкните в опросы 👇
Опубликован 23 янв.
Привет, Чемпионы!🏆 Для тех, кто ещё не остыл от нашего RAG Challenge или хочет опробовать все новые приколюхи, которые узнал за время соревы. Новый чемп на Kaggle - специально для любителей локал ллм. Коротко суть соревнования: Нужно построить систему поиска юридической информации по швейцарскому праву с использованием LLM. На входе: вопросы по праву на английском языке. На выходе: список наиболее релевантных правовых источников Швейцарии (статьи законов, судебные решения и т.п., обычно на немецком). Формат ответа: точные цитаты из предоставленного корпуса, разделённые ; Оценивается не текст ответа, а насколько точно ты угадал нужные источники. Метрика: Macro F1 по совпадению цитат. Сроки: 4 месяца 🤯 Призовые: 10 000$ (по-больше, чем у нас) Есть обучающие данные с правильными цитатами и скрытый тест. Это code competition на Kaggle: нужно сдать submission.csv и ноутбук, который воспроизводит результат офлайн, без интернета. Идея: показать, что твой retrieval-pipeline (BM25, embeddings, агенты, гибриды и т.д.) умеет стабильно находить правильные юридические источники, а не просто генерировать ответы. За обзор спасибо @ATKot🙏 ✈️ Го, решать...
Привет, Чемпионы! 🏆🚀 Kaggle выкатили Community Benchmarks - новый продукт, который позволяет самому сообществу создавать, запускать и шарить собственные бенчмарки для оценки ИИ. И да, бесплатно 😎 Что это значит на практике: 🧪 Свои eval’ы и задачи - от простых загадок до сложных агентных сценариев 🧩 kaggle-benchmarks SDK - единый API для Gemini, Claude, Qwen, DeepSeek и других 🖼️ Мультимодальность - текст + изображения, структурированные JSON-выходы ⚖️ LLM-as-a-Judge - оценивай креатив, код и рассуждения другим LLM 📊 Оценка на датасетах - прогон по pandas DataFrame с агрегацией метрик 🤖 Agentic-фичи - тулзы, sandboxed Python, игровые циклы И самое важное - публикация прямо на Kaggle 📢 Можно собрать несколько задач в бенчмарк, выложить его, и даже добавить citation для научных работ. Комьюнити уже делает крутые вещи: 🍋 рисование (Lemonasso) 🏥 медицинские и safety-бенчмарки 🌍 кросс-культурный интеллект 🔐 криптоанализ 🏭 инженерные задачи из реального мира Kaggle прямо говорит: evals - это сложно, и без сообщества масштабироваться невозможно. Поэтому теперь бенчмарки — не только от больших лаб, но и от вас 💪 Если вы тестируете LLM, строите агентов или просто хотите мерить не ощущения, а качество - это очень сильный апдейт экосистемы. #kagglenews
Hashtags
Опубликован 16 янв.
Привет, Чемпионы! 🏆 Подводим итоги нашего первого челленджа на Kaggle! Поздравляем победителей: • Первая тройка получает 💸+ мерч • Участники с 4 и 6 места получают по комплекту мерча • @Rustikhak участвовал вне зачёта и получает респект за мастер-класс • Приз за лучшее публичное решение получает @IgorSharygin по мнению 3-х экспертов за необычный подход, llm генерирует примеры для другой llm, локальная модель, SQL-агент Появились победные решения всех призеров из топ-3 - там есть на что посмотреть! Надеемся вам понравилось! 😇 P.S.: Информация для призёров по получению призов будет в чате, обозначьтесь пожалуйста в топике "Хакатон DFS" с какого вы места.
Опубликован 15 янв.
Привет, Чемпионы!🏆 Google обновила MedGemma до версии 1.5 - и это реально важный шаг для медицинского ИИ. Теперь модель умеет работать не с плоскими картинками, а с объёмными данными: КТ, МРТ и гистология анализируются как единое целое, а не по отдельным срезам. Именно так и видят патологию врачи 👩⚕️👨⚕️ Что нового коротко: 🧠 MedGemma 1.5 - лучше понимает медкарты, умеет локализовать зоны патологии, +14% точности на МРТ 🎙 MedASR - модель для диктовки диагнозов и анамнеза, заточенная под медтермины (до –80% ошибок против Whisper) 💻 Открытые веса + локальный запуск - можно разворачивать без облаков и интернета А теперь самое интересное 👇 🚀Kaggle-хакатон от Google Health AI Google предлагает не просто поиграться с моделью, а собрать полноценное демо-приложение для медицины или life sciences на базе MedGemma и HAI-DEF моделей. Что ждут от участников: 🔹 реальную проблему (диагностика, воркфлоу врачей, общение с пациентами) 🔹 использование минимум одной HAI-DEF модели 🔹 код, понятный пайплайн и продуктовую логику 🔹 3-минутное видео + write-up до 3 страниц Оценивают: 📊 пользу для медицины 🧩 уместность ИИ 🛠 техническую реализуемость 🎬 качество исполнения и сторителлинг Призовой фонд: 🤑 75 000$ Сроки: до 24 февраля Если давно хотелось сделать настоящий medical AI-продукт, а не очередной ноутбук с inference - это отличный повод 💥 Модели уже есть. Данные есть. Осталось ваше видение.
Опубликован 14 янв.
🆕 Новый год, новый обзор на Хабр по AI-security и интерпретируемости от @ivanich_spb В прошлый раз разбирались почему не все джейлбрейки одинаково полезны. На этот раз исследование от Anthropic - как вскрывали "черный ящик" их топ LLM-ки (Claude Sonnet). И бонусом ссылки на сервис, где можно самим порулить поведением опенсорсных моделек. 🚽 Го читать!
Опубликован 13 янв.
Привет, Чемпионы!🏆 Продолжаем подводить итоги челленджа: - появляются райт-апы от топ-участников, тоже можете выложить свой - по кнопке Late Submission можно отправить решение и получить результат сразу на всём тестовом датасете @IgorSharygin , который большую часть хакатона был топ-1 на паблике выложил статью на Хабр о своём участии и решении. Ещё одна статья от Игоря про его путь в МЛ на Stepik, в том числе и про наш Соревновательный курс. Насыпем автору кармы! 🥇 Ждём решение от участника с первого места и спорим кому отдавать приз за лучшее публичное решение! 👀 Обсуждать и делиться впечатлениями можно в чате. 👨💻