Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
🇫🇷🥋Judo paralímpico
Marta Arce, bronce en -57 kilos J2#Paris2024#Paralímpicos#Judo
La judoca española Marta Arce consiguió este viernes la cuarta medalla paralímpica de su carrera tras adjudicarse el combate por el bronce en la categoría de -57 kilos J2 de los Juegos de París, un éxito que le llega doce años después, tras una larga travesía con varios amagos de retirada y como madre de familia numerosa.
La vallisoletana, abanderada en la Ceremonia de Inauguración, volvió a saborear la alegría de estar en un podio paralímpico, y lo hizo por primera vez acompañada de su marido y sus tres hijos, Kenji, Issei y Yumi, por lo que fue doble para esta veterana judoca.
Su andadura comenzó con buenas sensaciones ya que se impuso por la vía rápida en su primera pelea a la turca Dondu Yeyilsurt, campeona del mundo en 2022 y de Europa en 2023, en la clase J1 (judocas ciegos), gracias a un 'waza-ari' y un 'ippon'.
Luego, le tocó una rival uzbeka, siempre duras, como Kumushkhon Khodjaeva, que la apeó del billete a la final al conseguir marcar un 'waza-ari', imposible de remontar para la vallisoletana, que tuvo un poco de tiempo para reponerse de cara a la pelea por el bronce.
Y ahí, fue demoledora con la brasileña Lucía da Silva Teixeira, a la que batió 'ippon' apenas iniciado el combate, una especie de revancha también para la vallisoletana, que perdió el oro en Pekín 2008 ante la venezolana Naomi Soazo a los tres segundos.
https://www.europapress.es/deportes/olimpiadas-00169/noticia-marta-arce-mete-semifinales-judo-peleara-medallas-57-kilos-j2-20240906121031.html
🏆@Info288_deportes
Латинская Америка в спорте: Олимпиада, Формула-1 и громкие победы недели
👉Стартовали Зимние Олимпийские игры — болеем за Латам!
С 6 по 22 февраля 2026 года в Италии проходят Winter Olympic Games 2026 — главные зимние соревнования планеты.
На Играх выступают спортсмены из Аргентины, Бразилии, Чили, Колумбии, Мексики и других стран региона. Для Латинской Америки участие в зимней Олимпиаде — уже серьёзное достижение.
Держим кулаки за спортсменов и желаем им ярких стартов и, возможно, исторических медалей ✨
👉Checo Pérez будет выступать за Cadillac в Формуле-1 в 2026 году
Американская команда Cadillac впервые выходит в Formula 1 и уже представила свой болид на сезон-2026.
Одним из пилотов станет мексиканец Sergio Pérez. Для Латинской Америки это важная новость — Checo начинает новый этап карьеры в новой команде.
👉Панамец Хорхе Кастельбланко выиграл Международный марафон CAF в Каракасе
8 февраля в Каракасе прошёл Maratón Internacional CAF — один из крупнейших международных марафонов Латинской Америки, организуемый Банком развития региона.
Победителем среди мужчин стал панамец Хорхе Кастельбланко (2:15:18), установив рекорд трассы.
🥈 Хосе Антонио Рейес (Венесуэла) — 2:20:41
🥉 Фернандо Рамиро Морено (Эквадор) — 2:20:43
У женщин победила эквадорка Сильвия Патрисия Ортис (2:33:56), также с рекордом дистанции.
#Венесуэла#Панама#Эквадор#Марафон#ЛегкаяАтлетика#Judo#СпортЛАТАМ#Formula1
👉Всегда свежие новости о странах Латинской Америки
Летом наши спортсмены ездили в клуб «Вандер» (@vanderclub), чтобы попробовать себя в джиу-джитсу и, вместе с этим улучшить свой партер!
Выражаем огромную благодарность руководителю направления «бжж, грэпплинг» КЕ «Вандер» @vanderclubРазмадзе Георгию за то, что пригласили наших спортсменов на совместную тренировку 💪🏼
#детидзюдо#дзюдо#judo#дзюдомосква#judokaisei#клубдзюдомастер#клубмастер#judozao#дзюдозао
Тренировочный процесс БЖЖ
#vanderclub#вандерклуб#judo#bjj#grappling#дзюдо#бжж#грэпплинг#наборнадзюдо#наборнабжж#дзюдомосква#бжжмосква#грэпплингмосква#judozao#дзюдозао#gojirajj