7.09.2025 состоялся релизPithon 3.14!
На фоне хайпа про NoGIL всё позабыли про другие фичи. Особенно про Multiple Interpreters, который обещает изоляцию процессов но с эффективностью потоков! На сколько действительно это будет эффективно мы узнаем позже, потому что сейчас это лишь первый релиз с ограничениями и недоработками.
Но что там про NoGIL? Теперь этот режим не экспериментальный, а официально поддерживаемый, но опциональный.
Чтобы запустить без GIL нужна специальная сборка. И перед стартом нужно объявить переменную PYTHON_GIL=0
Для вас я собрал готовый репозиторий где достаточно запустить скрпит, который всё сделает:
▫️ соберет релизный Python 3.14 в новый Docker-образ
▫️ запустит тесты в контейнере (GIL, NoGIL, MultiInterpreter)
▫️ распечатает результаты
Тест очень простой, усложняйте сами)
Вот какие результаты у меня:
=== Running ThreadPoolExecutor GIL ON
TOTAL TIME: 45.48 seconds
=== Running ThreadPoolExecutor GIL OFF
TOTAL TIME: 6.14 seconds
=== Running basic Thread GIL ON
TOTAL TIME: 45.54 seconds
=== Running basic Thread GIL OFF
TOTAL TIME: 4.74 seconds
=== Running with Multi Interpreter
TOTAL TIME: 18.30 seconds
Если сравнивать GIL и NoGIL, то на мои 32 ядра прирост х7-x10 (почему не х32? 🤷). При этом нам обещают что скорости будут расти с новыми релизами.
Режим без GIL похож (визуально) на async, тоже параллельно, тоже не по порядку. Но это не IO! и от того некоторый диссонанс в голове 😵💫, нас учили не так!
Интересно, что чистый Thread работает быстрей чем ThreadPoolExecutor без GIL.
Ну и где-то плачет один адепт мульти-интерпретаторов😭 Теперь нужно искать где они могут пригодиться с такой-то скоростью. Скорее всего своя область применения найдется.
Отдельно я затестил память и вот что вышло на 32 потока:
ThreadPoolExecutor GIL ON
305.228 MB
ThreadPoolExecutor GIL OFF
500.176 MB
basic Thread GIL ON
90.668 MB
basic Thread GIL OFF
472.444 MB
with Multi Interpreter
1267.788 MB
Пока не знаю как к этому относиться)
В целом - радует направление развития!
#release
#timeseries
Ekambaram, Vijay, Arindam Jati, Pankaj Dayama, Sumanta Mukherjee, Nam H. Nguyen, Wesley M. Gifford, Chandra Reddy, and Jayant Kalagnanam. 2024. “Tiny Time Mixers (TTMs): Fast Pre-Trained Models for Enhanced Zero/Few-Shot Forecasting of Multivariate Time Series.” arXiv [Cs.LG]. arXiv. http://arxiv.org/abs/2401.03955.
#timeseries
Finding a suitable forecasting metric to evaluate the forecasting models is often the key to a forecasting project. Right? We use metrics when developing models, we also use metrics to monitor models.
There are a bunch of metrics people choose from or adapt from. To be faster when choosing and adapting metrics, I created a page on the properties of different metrics for time series forecasting problems. For reproducibility, I also included all the code used to write this page.
https://dl.leima.is/time-series/timeseries-metrics.forecasting/
#Tableau#timeSeries
📊
Forecasting and Time Series Analysis in Tableau
Use Tableau to work with time series, generate forecasts and even add R functionality to enhance Tableau.
🔗Link
-----
Canal principal: @repo_science
Cupones: @freecoupons_reposcience
-----
#TimeSeries#Analysis#Python
⌚️
Forecasting Models and Time Series for Business in Python
Time Series Analysis in Python. Demand Planning & Business Forecasting. Forecast with 6 Models: Prophet, ARIMA & More.
-----
Main channel: @repo_science
Coupons: @freecoupons_reposcience
-----
#вакансия#vacancy#job#timeseries
#datasciense#remote
Вакансия: Middle/ Senior Data Scientist
Кадровое агентство: DevHunt
ЗП: от 150.000 до 250.000 руб на руки
Формат: удаленка
Почему стоит выбрать именно эту позицию:
- Удаленка с гибким началом рабочего дня
- Свобода в принятии решений
- Возможности для роста
- Никакого тайм-трекинга
- Неформальная атмосфера с минимальным числом бюрократии
- Проекты не "в стол"
- Плюшки IT-аккредитации
- Годовые бонусы: х1, х1.5
- ДМС после испытательного срока
Чек-лист идеального кандидата:
- Опыт ML-разработки на Python от 3х лет
- Опыт работы с Pandas, NumPy, SсiPy, scikit-learn, Keras/TensoFlow
- Опыт работы с XGboost, LightGBM, Random Forest, линейными моделями, основными архитектурами нейронных сетей. Понимание механизмов их работы
- Знание SQL на продвинутом уровне, опыт работы с реляционными СУБД (PostgreSQL, Oracle, MS SQL и пр.)
Опыт работы с *nix системами
- Навыки работы с Git и с Conda окружениями
Будет плюсом:
- Опыт разработки проектной документации в части подготовки разделов по предиктивному анализу
- Опыт разработки архитектуры данных и структур баз данных
- Знание и опыт работы с ETL/ELT инструментами
Знание TimescaleDB, InfluxDB, AVEVA (OSIsoft) PI System
- Понимание специфики работы IT-интегратора (outsource)
- Опыт работы в нефтегазовой или смежной области
Задачи:
- Реализации проектов по предиктивной аналитике на промышленных предприятиях
- Анализ и прогнозирование временных рядов
- Анализ производственных процессов и выработка требований к сбору данных
Выбор и обоснование моделей машинного обучения для решения бизнес-задач
- Конструирование признаков для ML-моделей (feature engineering)
Выбор и обоснование метрик для оценки моделей машинного обучения
- Интерпретация результатов функционирования моделей машинного обучения
- Разработка и автоматизация ML-пайплайнов
Контакт:@barnes_recruiter
#Tableau
#Forecasting#TimeSeries
📊
Forecasting and Time Series Analysis in Tableau
Use Tableau to work with time series, generate forecasts and even add R functionality to enhance Tableau.
-----
Main channel: @repo_science
Coupons: @freecoupons_reposcience
-----
#tableau#TimeSeries#Forecasting
📈
Forecasting and Time Series Analysis in Tableau
Use Tableau to work with time series, generate forecasts and even add R functionality to enhance Tableau.
-----
Main channel: @repo_science
Coupons: @freecoupons_reposcience
-----