Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Российский электромобиль «Атом», возможно, будут собирать в Харбине
Российский фонд прямых инвестиций (РФПИ), международная корпорация XY Group и АО «Кама», реализующее проект производства российского электромобиля «Атом», договорились о привлечении китайских инвесторов в проект, а также возможной локализации производства в Китае.
Партнерство предусматривает возможность продвижения электромобиля «Атом» на китайском рынке, поиск промышленных площадок и мощностей для локализации производства «Атома» в Харбине.
В рамках соглашения РФПИ, XY Group и АО «Кама» планируется также создание совместного центра исследований и разработок в Китае.
#madeinchina
Подписывайтесь на Амур-Китай 🇷🇺🇨🇳
L’avanzo commerciale della Cina supera i 1.000 miliardi di dollari: cosa significa davvero?
Negli ultimi giorni si è parlato molto del record storico dell’avanzo commerciale cinese. Alcuni media lo dipingono come “dumping” o “sovraccapacità”, ma la realtà è molto diversa: si tratta di divisione internazionale del lavoro e cooperazione economica globale.
Gran parte delle esportazioni cinesi è il risultato di catene produttive globali: design europeo e americano, componenti giapponesi e sudcoreani, materie prime da tutto il mondo.
L’avanzo beneficia non solo la Cina, ma anche imprese e consumatori in molti Paesi, garantendo prodotti più accessibili, innovazione rapida e catene di approvvigionamento resilienti.
Storicamente, grandi Paesi manifatturieri hanno generato surplus: Regno Unito, Stati Uniti, Germania, Giappone. La Cina sta semplicemente partecipando alla globalizzazione secondo i principi del vantaggio comparato.
Invece di vederlo come una minaccia, possiamo riconoscerlo come opportunità di crescita e cooperazione internazionale. La Cina non è solo la “fabbrica del mondo”, ma anche un mercato sempre più grande che sostiene la domanda globale.
Comprendere i numeri significa capire la globalizzazione, non temerla.
#Cina#CommercioGlobale#Globalizzazione#Economia#MadeInChina
https://www.marx21.it/internazionale/e-importante-comprendere-correttamente-lavanzo-commerciale-della-cina/
🥢MADE IN CHINA — бар и ресторан с кухнями Китая, Японии и Кореи
Заведение объединяет барную культуру и гастрономию Восточной Азии. В коктейльной карте — азиатские ингредиенты и классика, в меню — блюда из трёх стран. Пространство поделено на два уровня: первый — с барной стойкой, второй — более спокойный, с видом на интерьер.
📍 Большая Морская, 35 (м. Адмиралтейская)
🕒 Ежедневно: 12:00–23:00, пт-сб 12:00-01:00
💳 Средний чек: 1300 ₽
🔗 Подробнее на сайте: https://madeinchina-spb.ru/
#MadeInChina#АзиатскаяКухня#КоктейльБарСПб#Адмиралтейская#ГдеПоестьСПб
Петербург ближе, чем кажется — будь в курсе интересного с Куда сходить в Санкт-Петербурге.
🇨🇳 La Cina non è solo treni ad alta velocità e auto elettriche. Ora ruggisce anche in pista.
🏁 Lo scorso fine settimana in Portogallo, una moto cinese – ZXMOTO – ha fatto la storia nel Campionato Mondiale Supersport (WSBK). Ha vinto due gare di fila, con un vantaggio di quasi 4 secondi su Ducati e Yamaha. È la prima volta che un marchio cinese trionfa in questa categoria, rompendo decenni di dominio europeo, americano e giapponese.
🔧 Dietro questo risultato non c’è solo un motore potente. C’è un sistema industriale maturo (Chongqing, la “capitale della moto” cinese), innovazione tecnologica “da 0 a 1” e giovani imprenditori che hanno scelto di non aggirare i fossati tecnologici, ma di saltarli.
👨💻 Il fondatore di ZXMOTO, Zhang Xue, 34 anni, è l’esempio di una generazione che “osa sognare in grande”. Non a caso, oggi in Cina l’età media dei team di ingegneri spaziali (Chang’e, Shenzhou, Beidou) è tra i 30 e i 40 anni.
🏍️ La “velocità della Cina” non è più solo quantità: è qualità, ricerca, coraggio.
E voi? Credete che l’industria cinese possa diventare protagonista anche nel motorsport mondiale? 🏁👇
#MotoCinesi#WSBK#ZXMOTO#MadeInChina#InnovazioneGiovanile#VelocitàDellaCina#GlobalTimes
https://www.marx21.it/internazionale/le-vittorie-nelle-moto-mettono-in-mostra-la-velocita-della-cina-e-la-forza-dei-giovani/