Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
🌍 The Canadian city of Winnipeg is nicknamed the "Gateway to the West" because it sits where major rail lines and highways converge—making it a key hub in North American transport geography. ✨
#transport⚡#infrastructure⚡#connectivity⚡#geography⚡#nature⚡#earth
👉subscribe Amazing Geography
👉more Channels
⚡️ Natijalar bilan faxrlanamiz!
Beeline Uzbekistan Opensignal tomonidan 2025-yilning birinchi yarmida Oʻzbekistondagi eng tez mobil internet va barqaror tarmoqqa ega operator sifatida e’tirof etildi!
Buning zamirida ulkan mehnat yotadi: 2024-yil boshidan beri biz 5 850 ta baza stansiyalarini qurish va yangilashga sarmoya kiritdik. Va bu o’z natijasini berdi — mamlakatda o'rtacha yuklab olish tezligi 20,2 Mbit/s!
Ammo gap faqat tezlikda emas —Opensignal ma’lumotlariga ko‘ra, biz O‘zbekistonda eng barqaror tarmoqni taqdim etamiz — uzilishlarsiz va muammolarsiz ulanishingizni ta’minlaymiz.
Bundan tashqari, biz Upload Speed Experience nominatsiyasida yana ikki yetakchi operator bilan birinchi o‘rinni bo‘lishmoqdamiz: 5.8–6.6 Mbit/s yuklash tezligi — bu esa videodarslar, striming, onlayn-o‘yinlar va videoqo‘ng‘iroqlar uchun juda muhim!
Bu ma’lumotlarning barchasi 2025-yilning birinchi yarmida Opensignal tomonidan o‘tkazilgan millionlab real o‘lchovlarga asoslangan.
Biz tez va barqaror internetni mamlakatning barcha hududlarida taqdim etish uchun ishlashda davom etamiz.
• • •
⚡️Гордимся результатами!
Beeline Uzbekistan признан Opensignal оператором с самым быстрым мобильным интернетом и наиболее стабильной сетью в Узбекистане за первую половину 2025 года!
За этим стоит огромная работа: с начала 2024 года мы инвестировали в строительство и обновление 5 850 базовых станций. И это дало результат — средняя скорость скачивания 20,2 Мбит/с в стране!
Но дело не только в скорости — мы обеспечиваем самую стабильную сеть в стране по данным исследования Opensignal, чтобы вы всегда были на связи: без лагов, задержек и сбоев.
Мы также делим первое место с двумя ведущими операторами в номинации Upload Speed Experience — со скоростью 5,8–6,6 Мбит/с, что особенно важно для стримов, онлайн-игр, видеозвонков и всего, что требует стабильной сети.
Все данные основаны на миллионах реальных замеров от Opensignal за первую половину 2025 года.
Мы продолжим работать, чтобы быстрый и стабильный интернет был доступен в каждом уголке страны.
#BeelineUzbekistan#Opensignal#MobileExperience#MobileNetworks#Connectivity#DO1440#AI1440
Myriota Secures $50M Funding
Myriota has successfully raised $50 million in funding for its direct-to-orbit satellite connectivity solutions aimed at the Internet of Things. This funding round took place on December 19, 2024. For more details, visit Myriota.
#Myriota#Funding#Satellite#IoT#Connectivity#SpaceTech#DirectToOrbit#Investment#TechNews#Telecommunications
February Startup Fundraising Highlights
MAVOCO AG raises $11.37M for IoT software solutions. 🛠️
Sirius Medical secures $10.33M for medical innovations. 🏥
Little Otter, focusing on children's mental health, raises $9.50M. 🌱
Lorikeet collects $9M for AI-driven issue resolution tools. 🤖
Easpeed Technology gains $7.92M for aerial imaging advancements. 📷
Digital Entertainment Asset earns $6.44M to enhance labor through gamification. 🎮
SimpliFed raises $4M for virtual breastfeeding support. 👶
EPYR brings in $3.10M for renewable heat solutions. ♻️
Presentation AI receives $3M to streamline presentation creation. 📊
LogicStar AI raises $3M to fix bugs in applications. 🔧
#IoT#Healthcare#MentalHealth#AI#Tech#Startups#Funding#RenewableEnergy#Gaming#Web3#Breastfeeding#Presentation#Efficiency#Innovation#ThermalEnergy#BugFixing#Software#Growth#Connectivity#Crowdsourcing