Заметка начинающим, которые часто сталкиваются с подобной непоняткой.
Ситуация следующая, есть список файлов:
names = [
'image.bmp',
'second.txt.bkp',
'data.db',
'.config.cfg',
'file.ext.bkp'
]
И мы хотим убрать у них окончание ".bkp".
Не знаю зачем, пример довольно надуманный) Но суть он показывает, а это главное.
Те, кто еще не очень знаком с библиотекой os.path или pathlib, вероятно решат обработать имена как строки. И тут вполне подойдет метод строки strip().
Что делает этот метод? Он отрезает указанные символы по обеим сторонам строки. Если ничего не указать, то убирает невидимые символы (пробелы, табуляции и переносы строк).
В нашем случае будет выглядеть вот так:
>>> name.strip('.bkp')
То есть просим удалить строку '.bkp' по краям имени файла, если таковая есть.
Можно применить аналогичный метод rstrip(), чтобы отрезать только справа, но для этого примера используем обычный.
>>> for name in names:
>>> print(name.strip('.bkp'))
image.bm
second.txt
data.d
config.cfg
file.ext
Хм, что-то не то с нашими именами! Что случилось??? Видим нежелательное переименование в именах, где и близко не было указанной строки '.bkp'
А дело всё в том, что данный метод ищет не указанную строку, а указанные символы, и не важно в каком порядке.
Для метода strip() строка '.bkp' это не паттерн для поискаа список символов. Потому он отрезал симовол 'p' от '.bmp' и удалил точку из файла '.config.cfg'.
Как тогда правильно заменить именно паттерн? Для начинающего можно посоветовать метод строки replace(), который как раз использует для замены указанную строку целиком. В нашем примере заменим её на пустую строку.
>>> for name in names:
>>> print(name.replace('.bkp', ''))
image.bmp
second.txt
data.db
.config.cfg
file.ext
Уже лучше, но помните, это лишь пример про strip(). Для работы с именами файлов есть способы и более "правильные", дающие однозначно верный результат. Я взял файлы только в качестве примера. Даже replase() тут может сделать не то что ожидаем.
Просто впредь будьте внимательны с этим strip().
#basic
#timeseries
Ekambaram, Vijay, Arindam Jati, Pankaj Dayama, Sumanta Mukherjee, Nam H. Nguyen, Wesley M. Gifford, Chandra Reddy, and Jayant Kalagnanam. 2024. “Tiny Time Mixers (TTMs): Fast Pre-Trained Models for Enhanced Zero/Few-Shot Forecasting of Multivariate Time Series.” arXiv [Cs.LG]. arXiv. http://arxiv.org/abs/2401.03955.
#timeseries
Finding a suitable forecasting metric to evaluate the forecasting models is often the key to a forecasting project. Right? We use metrics when developing models, we also use metrics to monitor models.
There are a bunch of metrics people choose from or adapt from. To be faster when choosing and adapting metrics, I created a page on the properties of different metrics for time series forecasting problems. For reproducibility, I also included all the code used to write this page.
https://dl.leima.is/time-series/timeseries-metrics.forecasting/
#Tableau#timeSeries
📊
Forecasting and Time Series Analysis in Tableau
Use Tableau to work with time series, generate forecasts and even add R functionality to enhance Tableau.
🔗Link
-----
Canal principal: @repo_science
Cupones: @freecoupons_reposcience
-----
#TimeSeries#Analysis#Python
⌚️
Forecasting Models and Time Series for Business in Python
Time Series Analysis in Python. Demand Planning & Business Forecasting. Forecast with 6 Models: Prophet, ARIMA & More.
-----
Main channel: @repo_science
Coupons: @freecoupons_reposcience
-----
#вакансия#vacancy#job#timeseries
#datasciense#remote
Вакансия: Middle/ Senior Data Scientist
Кадровое агентство: DevHunt
ЗП: от 150.000 до 250.000 руб на руки
Формат: удаленка
Почему стоит выбрать именно эту позицию:
- Удаленка с гибким началом рабочего дня
- Свобода в принятии решений
- Возможности для роста
- Никакого тайм-трекинга
- Неформальная атмосфера с минимальным числом бюрократии
- Проекты не "в стол"
- Плюшки IT-аккредитации
- Годовые бонусы: х1, х1.5
- ДМС после испытательного срока
Чек-лист идеального кандидата:
- Опыт ML-разработки на Python от 3х лет
- Опыт работы с Pandas, NumPy, SсiPy, scikit-learn, Keras/TensoFlow
- Опыт работы с XGboost, LightGBM, Random Forest, линейными моделями, основными архитектурами нейронных сетей. Понимание механизмов их работы
- Знание SQL на продвинутом уровне, опыт работы с реляционными СУБД (PostgreSQL, Oracle, MS SQL и пр.)
Опыт работы с *nix системами
- Навыки работы с Git и с Conda окружениями
Будет плюсом:
- Опыт разработки проектной документации в части подготовки разделов по предиктивному анализу
- Опыт разработки архитектуры данных и структур баз данных
- Знание и опыт работы с ETL/ELT инструментами
Знание TimescaleDB, InfluxDB, AVEVA (OSIsoft) PI System
- Понимание специфики работы IT-интегратора (outsource)
- Опыт работы в нефтегазовой или смежной области
Задачи:
- Реализации проектов по предиктивной аналитике на промышленных предприятиях
- Анализ и прогнозирование временных рядов
- Анализ производственных процессов и выработка требований к сбору данных
Выбор и обоснование моделей машинного обучения для решения бизнес-задач
- Конструирование признаков для ML-моделей (feature engineering)
Выбор и обоснование метрик для оценки моделей машинного обучения
- Интерпретация результатов функционирования моделей машинного обучения
- Разработка и автоматизация ML-пайплайнов
Контакт:@barnes_recruiter
#Tableau
#Forecasting#TimeSeries
📊
Forecasting and Time Series Analysis in Tableau
Use Tableau to work with time series, generate forecasts and even add R functionality to enhance Tableau.
-----
Main channel: @repo_science
Coupons: @freecoupons_reposcience
-----
#tableau#TimeSeries#Forecasting
📈
Forecasting and Time Series Analysis in Tableau
Use Tableau to work with time series, generate forecasts and even add R functionality to enhance Tableau.
-----
Main channel: @repo_science
Coupons: @freecoupons_reposcience
-----