TGTGInsighttelegram intelligenceLIVE / telegram public index
Назад кон каналите
DataSciencePRO avatar

TGINSIGHT CHAT

DataSciencePRO

@ds1pro

Technologies

Все нужное и полезное из мира дата сатанистов)

Претплатници762Тековни претплатници
Следени објави605Број на индексирани објави
Неодамнешен опфат3,402Збир на неодамнешни прегледи
Неодамнешни објави

Неодамнешни објави

Ознака: #datascience · 11 објави

当前筛选 #datascience清除筛选

Објавено 26 мар.

✔️ СuML от NVIDIA: Scikit-learn на скорости GPU – без единой строчки нового кода! Все мы любим scikit-learn за его простоту и мощь. Но что если ваши модели обучаются слишком долго на больших данных? 🤔 NVIDIA предлагает решение! Вы берете свой обычный скрипт cо scikit-learn, добавляете всего две строки в начало, и он начинает работать в 10, 50, а то и 100+ раз быстрее на NVIDIA GPU! 🔥 ✨ Как это работает? Библиотека cuml от NVIDIA содержит супероптимизированные для GPU версии многих алгоритмов машинного обучения. С помощью простого вызова cuml.patch.apply() вы "патчите" установленный у вас scikit-learn прямо в памяти. Теперь, когда вы вызываете, например, KNeighborsClassifier или PCA из sklearn: ▶️Патч проверяет, есть ли у вас GPU NVIDIA. ▶️Проверяет, есть ли в cuml быстрая GPU-версия этого алгоритма. ▶️Если да – запускает ускоренную версию на GPU! 🏎️ ▶️Если нет (нет GPU или алгоритм не поддерживается) – спокойно запускает обычную CPU-версию scikit-learn. Ключевые преимущества: ✔️ Нулевые изменения кода: Ваш scikit-learn код остается прежним. Добавляете только2 строчки: import cuml.patch и cuml.patch.apply(). ✔️ Колоссальное ускорение: Получите прирост производительности на порядки для поддерживаемых алгоритмов (KNN, PCA, линейные модели, Random Forest (инференс), UMAP, DBSCAN, KMeans и др.) за счет мощи GPU. ✔️Автоматическое переключение между GPU и CPU. Ваш скрипт будет работать в любом случае. Топ инструмент для всех, кто работает с scikit-learn на задачах, требующих значительных вычислений, и у кого есть GPU от NVIDIA. 👇 Как использовать: Установите RAPIDS cuml (лучше через conda, см. сайт RAPIDS): python conda install -c rapidsai -c conda-forge -c nvidia cuml rapids-build-backend Добавьте в начало скрипта: import cuml.patch cuml.patch.apply() Используйте scikit-learn как обычно! Попробуйте и почувствуйте разницу! 😉 ▪Блог-пост ▪Colab ▪Github ▪Ускоряем Pandas @ai_machinelearning_big_data #python#datascience#machinelearning#scikitlearn#rapids#cuml#gpu#nvidia#ускорение#машинноеобучение#анализданных

761 views

Објавено 9 фев.

🐼Pandas умирает медленной и мучительной смертью. Это самая популярная в мире библиотека обработки данных, но она медленная, и многие библиотеки значительно превзошли ее. Проблема альтернатив Pandas в том, что никто не хочет изучать новый API. Давайте посмотрим правде в глаза: люди не будут переносить свои проекты, га другие фреймворки, без особой причины. Я уже давно работаю с FireDucks🦆 Эта библиотека в разы быстрее Pandas, и вам не придется менять код старых проектов для перехода на нее. Вы можете изменить *одну* строку кода и весь остальной код будет работать на FireDucks : import fireducks.pandas as pd Вы также можете запустить свой код *не* изменяя ни одной строки, используя хук: python $ python -mfireducks.imhook yourfile[.]py FireDucks — это многопоточная библиотека с ускорением компилятора и полностью совместимым с pandasAPI. Она быстрее, чем Polars. Ниже приведена ссылка на некоторые бенчмарки, сравнивающие Pandas, Polars и FireDucks. FireDucks побеждает с отрывом. ⛓️Здесь находится репозиторий FireDucks на GitHub: https://github.com/fireducks-dev/fireducks ⛓️Если вы хотите пощупать либу, откройте этот пример: https://github.com/fireducks-dev/fireducks/tree/main/notebooks/nyc_demo ⛓️Если вы хотите сравнить FireDucks с Polars и Pandas, вот еще один блокнот: https://github.com/fireducks-dev/fireducks/blob/main/notebooks/FireDucks_vs_Pandas_vs_Polars.ipynb ⛓️И наконец, бенчмарки, с которыми стоит ознакомиться: https://fireducks-dev.github.io/docs/benchmarks/ ⭐️Подписаться: @data_analysis_ml #fireducks#Pandas#dataanalysis#datascience#python#opensource

725 views

Објавено 18 окт.

#DataScience 2021 Руководство по подготовке к Data Science интервью Автор: Р. Алимбеков Наука о данных (data science) — раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме. Объединяет методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма, статистические методы, методы интеллектуального анализа данных и приложения искусственного интеллекта для работы с данными, а также методы проектирования и разработки баз данных. Это практическое руководство, которое поможет вам успешно пройти собеседование по классическому машинному обучению. Книга содержит образцы теоретических вопросов, задаваемых на собеседовании по позиции Data Science. Что вы получите: -️ 6 глав, охватывающих самые разные темы: статистика и теория вероятности, машинное обучение с учителем, алгоритм градиентного спуска и лосс функция. -️ 77 вопросов для подготовки к собеседованию -️ Полезные ссылки и репозитории для подготовки СКАЧАТЬ 🗂

514 views

Hashtags

Објавено 7 јун.

​Топовые пакеты Python для очистки данных Специалисты по данным вынуждены тратить уйму времени на то, что привести эти данные в порядок и очистить их от лишнего. К счастью, для этого уже существует множество различных пакетов, помогающих быстрее избавиться от мусора. Подробнее о них в статье: https://nuancesprog.ru/p/15768/ #datascience

416 views

Hashtags

Објавено 19 окт.

​Топ-10 Python библиотек для Data Science В Data Science широко распространён Python. В связи с этим для него существует множество различных библиотек, которые решают различные задачи специалистов по данным. В этой подборке мы собрали популярные библиотеки и рассказали о том для чего они применяются и где их можно изучить: https://tprg.ru/lU7m #datascience

238 views

Hashtags

Објавено 29 авг.

​Топ-10 Python библиотек для Data Science В Data Science широко распространён Python. В связи с этим для него существует множество различных библиотек, которые решают различные задачи специалистов по данным. В этой подборке мы собрали популярные библиотеки и рассказали о том для чего они применяются и где их можно изучить: https://tprg.ru/lU7m #datascience

108 views

Hashtags

Објавено 5 авг.

Data Science для карьериста Книга предназначена для людей, которые еще не начали работать в Data Science, но в перспективе рассматривают такую возможность, а также для тех, кто только начал трудиться в этой сфере. Начинающие специалисты получат навыки, которые необходимы, чтобы стать дата-сайентистами, а джуниоры узнают, как повысить свою экспертность. Автор: Жаклин Нолис, Эмили Робинсон. Год: 2021 💾 Скачать книгу #books#русский#datascience

168 views

Објавено 2 авг.

Статья дня. 11 популярных библиотек Python для Data Science В этой статье мы рассмотрели самые популярные библиотеки Python для анализа и визуализации данных. Читать статью #читать#datascience#анализданных

148 views

Објавено 16 јул.

​Собеседование по Data Science: что нужно знать и где это изучить Если интересуетесь Data Science и хотите развивать свою карьеру в этом направлении, то заранее изучите основные темы и вопросы, которые вам могут задать на собеседованиях и которые необходимо знать, что действительно разбираться в этом направлении. Мы подготовили для вас статью, которая поможет в этом: https://tprg.ru/ovma #datascience

102 views

Hashtags

Објавено 24 апр.

​Собеседование по Data Science: чего от вас ждут Хотите стать специалистом по Data Science? Тогда проверьте свои знания и посмотрите, что ожидают от специалистов работодатели: https://tprg.ru/TVen #datascience

95 views

Hashtags

Објавено 9 фев.

​26 вопросов и ответов с собеседований по Data Science В этой статье собраны 26 вопросов разных уровней сложности по Data Science и машинному обучению, которые неизменно спрашивают на собеседованиях. Если вы считаете, что уже достаточно хорошо изучили эти темы или, наоборот, не уверены в собственных знаниях, то здесь вы можете их проверить: https://tprg.ru/zucx #datascience#ml

127 views