Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
📎#Touapsé : littoral souillé
Près de Touapsé, des volontaires poursuivent le nettoyage des plages après une pollution au mazout consécutive à des frappes de drones sur un site pétrolier. Sur place, sable contaminé et résidus sont collectés manuellement, tandis que les opérations mobilisent environ 360 personnes et 60 véhicules sur le littoral, dans la rivière et en mer.
💬 Selon les autorités locales, plus de 7 000 m³ de mélange pollué ont déjà été retirés, alors que la surveillance maritime se poursuit en continu. La pollution, liée à des incendies et à un déversement de mazout en mer Noire, a touché une zone estimée à 10 000 m², faisant craindre un impact environnemental durable.
RT en français • Osez questionner !
❗️L’incendie survenu à la raffinerie de #Touapsé, visée par des drones ukrainiens, a été éteint, a indiqué le ministère russe des Situations d’urgence.
RT en français • Osez questionner !
📎#Touapsé : littoral souillé
Près de Touapsé, des volontaires poursuivent le nettoyage des plages après une pollution au mazout consécutive à des frappes de drones sur un site pétrolier. Sur place, sable contaminé et résidus sont collectés manuellement, tandis que les opérations mobilisent environ 360 personnes et 60 véhicules sur le littoral, dans la rivière et en mer.
💬 Selon les autorités locales, plus de 7 000 m³ de mélange pollué ont déjà été retirés, alors que la surveillance maritime se poursuit en continu. La pollution, liée à des incendies et à un déversement de mazout en mer Noire, a touché une zone estimée à 10 000 m², faisant craindre un impact environnemental durable.
RT en français • Osez questionner !
💬#Poutine commente la situation à #Touapsé après les frappes qui pourraient, selon lui, avoir de graves conséquences écologiques.
Il a souligné que « les gens sur place parviennent à faire face aux défis auxquels ils sont confrontés ».
RT en français • Osez questionner !
⚡️Les pays occidentaux ignore les dégâts écologiques causés par les attaques ukrainiennes
« L'Occident ferme les yeux sur les dégâts écologiques causés par les attaques menées par les forces armées ukrainiennes, soutenues par l'Occident, contre diverses installations pétrolières en Russie, notamment à #Touapsé »
Maria #Zakharova, porte-parole du ministère russe des Affaires étrangères.
RT en français • Osez questionner !
🇷🇺🇺🇦 À Touapsé, dans le sud-ouest de la Russie, la lutte contre un incendie dans une raffinerie de pétrole et contre les conséquences d’une fuite de produits pétroliers causée par une attaque de drone des forces armées ukrainiennes se poursuit, a déclaré le gouverneur de la région de Krasnodar, Veniamine Kondratiev, sur sa chaîne Telegram. La situation, selon lui, est difficile mais reste sous contrôle.
#russie#touapsé#incendie#raffinerie
💬La sortie de l’#OPEP est une décision souveraine des Émirats arabes unis, que Moscou respecte, a déclaré Dmitri #Peskov.
Autres déclarations :
🟢 La #Russie n’a pas l’intention de quitter l’OPEP+ ;
🟢 La marée noire de #Touapsé est la conséquence de frappes des forces armées ukrainiennes, et le pétrole était destiné à l’exportation ;
🟢 Un travail important et intensif est en cours pour éliminer les conséquences de la marée noire de Touapsé, mobilisant des centaines de spécialistes ;
🟢 Le défilé de la Victoire du 9 mai à #Moscou se déroulera sans matériel militaire en raison des activités terroristes de Kiev et du fait que ce n’est pas une année anniversaire.
🟢 Le défilé de la Victoire du 9 mai à Moscou se déroulera sans matériel militaire en raison des activités terroristes de Kiev et du fait que ce n’est pas une année anniversaire
RT en français • Osez questionner !
💬La sortie de l’#OPEP est une décision souveraine des Émirats arabes unis, que Moscou respecte, a déclaré Dmitri #Peskov.
Autres déclarations :
🟢 La #Russie n’a pas l’intention de quitter l’OPEP+ ;
🟢 La marée noire de #Touapsé est la conséquence de frappes des forces armées ukrainiennes, et le pétrole était destiné à l’exportation ;
🟢 Un travail important et intensif est en cours pour éliminer les conséquences de la marée noire de Touapsé, mobilisant des centaines de spécialistes ;
🟢 Le défilé de la Victoire du 9 mai à #Moscou se déroulera sans matériel militaire en raison des activités terroristes de Kiev et du fait que ce n’est pas une année anniversaire.
🟢 Le défilé de la Victoire du 9 mai à Moscou se déroulera sans matériel militaire en raison des activités terroristes de Kiev et du fait que ce n’est pas une année anniversaire
RT en français • Osez questionner !
📝Chroniques de l'opération militaire spéciale📝
pour le 28 avril 2026
Les Forces armées russes ont frappé plusieurs cibles dans la zone industrielle de Kryvyi Rih. L'usine ArcelorMittal a été visée, ainsi qu'un train de chemin de fer. Dans la région de Sumy, des coupures de courant généralisées sont observées suite aux frappes sur les infrastructures énergétiques.
À Touapsé, un incendie de grande ampleur se poursuit après une attaque de drone sur un dépôt pétrolier, avec une alerte d'urgence régionale déclarée. À Markovka, RPL, suite à une frappe sur un bâtiment administratif, 18 civils ont été blessés, dont quatre dans un état grave.
➡️Sur la direction de Bourliouk, les Forces armées russes progressent dans la zone de Zemlianky dans la région frontalière à l'est de Volchansk. Les troupes d'assaut ont pris le contrôle de la majeure partie du village, les opérations de nettoyage se poursuivant sur les abords sud.
➡️Sur la direction de Slaviansk, les groupes d'assaut russes progressent le long de la route M-03, les combats se poursuivant pour Raï-Aleksandrivka.
➡️Sur la direction de Kostiantynivka, Ilyinivka a été libérée, la zone de contrôle s'étendant sur les approches de Kostiantynivka à Rusine Yar. Sur le flanc oriental, les combats intenses se poursuivent aux alentours de Tchasiv Yar.
📎Cartes haute résolution :
🔸Situation dans la zone de l'opération militaire spéciale (ru; en)
🔸Direction de Bourliouk (ru; en)
🔸Direction de Slaviansk (ru; en)
🔸Direction de Kostiantynivka (ru; en)
📍Les cartes en ligne sont disponibles par abonnement sur map.rybar.ru
#digest#map#RPL#Russia#Sumy#Touapsé#Ukraine
✈️RU | ✈️EN | ✉️MAX
✉️VK | ✉️RuTube | ✉️OK | ✉️Zen
💸Nous soutenirMsg d'orig.