TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #maritimeanalytics

当前筛选 #maritimeanalytics清除筛选

🚢 Арктическое судоходство обновило исторический максимум в 2025 году. По данным рабочей группы PAME при Arctic Council, в 2025 году в зону действия Полярного кодекса вошли 1 812 уникальных судов - на 40% больше, чем в 2013 году. Пройденная дистанция почти удвоилась — с 6,1 млн до 11,9 млн морских миль (+95%). Пик активности традиционно пришёлся на сентябрь (минимальная площадь льда): 1 060 судов - 58% годового трафика. Структура флота: ✔️ Рыболовные суда: 40%. ✔️ Cухогрузы, MPP: 2-е место. ✔️ Нефтеналивные танкеры: рост на 396% с 2013 г. ✔️ Балкеры: +156%. ✔️ Круизные суда: +123%. Ключевые драйверы — сырьевые проекты: Mary River Mine (рост балкерного трафика в Баффиновой бухте на 540%) и Yamal LNG (40 СПГ-танкеров в 2025 г.; до 2018 г. их почти не было). Рост отражает как сокращение ледового покрова, так и активизацию добычи и круизов в высоких широтах. 📌Arctic Council создан в 1996 году; межправительственный форум восьми арктических государств и представителей коренных народов. Организация не является коммерческой структурой и не имеет владельцев. #ArcticShipping#PolarCode#LNG#drybulk#maritimeanalytics

🚢Ship Recycling: рынок утилизации сохраняет стабильность (Week 08, 16–22 февраля 2026). Согласно отчету Athenian Shipbrokers S.A., на 8-й неделе 2026 года рынок утилизации флота демонстрирует стабильный тренд. Цены покупки судов на утилизацию в основных странах-реципиентах остаются на устойчивых уровнях без резких колебаний. По индикативам $/LDT: Индия — Bulker: $400; Tanker: $420; Container: $430. Бангладеш — Bulker: $405; Tanker: $425; Container: $435. Пакистан — Bulker: $425; Tanker: $445; Container: $455 (премия к региону). Турция — Bulker: $276; Tanker: $286; Container: $296. Пакистан сохраняет ценовое лидерство по всем типам тоннажа, что отражает ограниченное предложение качественных корпусов и конкуренцию за крупнотоннажные единицы. Индия и Бангладеш удерживают паритет с умеренной разницей по типам судов. Турция остается вне ценового диапазона Южной Азии, что обусловлено структурой спроса и макроэкономическими факторами. Долгосрочная динамика демонтажа (2011–2026) подтверждает снижение объемов в последние годы: после пиков 2012–2016 годов текущие уровни остаются существенно ниже исторических максимумов, что поддерживает ценовую устойчивость на фоне ограниченного притока старого тоннажа. 📌Athenian Shipbrokers S.A. — греческая брокерская компания, основанная в 1970-х годах, специализируется на S&P, чартеринге и аналитике рынков судоходства. Компания является частной и принадлежит греческим акционерам-основателям. #ShipRecycling#DemolitionMarket#SNP#ShippingMarkets#MaritimeAnalytics