Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
DIFFERENT DISEASE CAN ENTER OUR FARM DUE TO RELATED AND UNRELATED CAUSES AND CAUSE DAMAGE
.
#Infectious agent, for example, virus, bacteria, fungi, parasites
# food deficiency
#management problems
#Environmental problems
#food poisoning
Symptoms of disease in unhealthy chickens depend on the pathogen and the part of the body affected, and for the most part most diseases show these symptoms.
✔️ Shaving
✔️ Throwing wings
✔️ Diarrhea
✔️ Decreased appetite
✔️ Manbat
✔️ Paralysis
✔️ Sudden death
These and similar symptoms:-
When it occurs, it is important to identify sick chickens by careful observation and to consult a nearby specialist. Apart from this, giving medicine without properly identifying the disease and consulting a specialist may expose them to drug resistance, so it is appropriate to take necessary precautions.
https://t.me/starvetbooks
Local Conference of Youth on Climate Change was launched in Astana as part of the annual UN Climate Change Conference of Youth. The event was organized by the National Conservation Initiative, Sustainable Development Solutions Network and Nazarbayev University.
"The world needs a collective effort to limit global warming to 1.5 degrees. We are not on track. #Kazakhstan and #CentralAsia are one of the regions to bear the most acute effects of climate change. The imminence of the #environmental degradation requires immediate action and unwavering commitment to the #climategoals the region has set. As Kazakhstan is taking steps towards #carbonneutrality by 2060, we support the government, industry and civil society to underpin this with concrete actions," - said Johannes Baur, Head of Сooperation at the EU Delegation to Kazakhstan.
The fifth season of the International Prize #WEARETOGETHER has been launched.
▫️ Foreign citizens and NGOs can apply until June 23, 2025 on the official website of the Prize https://wearetogetherprize.com.
🌐 The Prize is available for volunteers and NGOs from across the globe. The laureates will receive a cash prize valued at $10,000 and an invitation to take part in the International Forum of Civil Participation #WEARETOGETHER, which is traditionally held in December in Moscow.
👉🏻 Prize nominations:
♻️“Sustainable Future”
For those who are leading projects in the field of environmental protection, environmental education, ecological consumption, “green” economy and technologies
#ecology#urbanism#biodiversity#recycling#environmental protection
🕊️“Human Assistance”
For those who run projects aimed at improving the well-being of vulnerable categories of citizens, providing social and humanitarian assistance to people, discovering talents and nurturing individuals, developing education and volunteerism.
▫️ Apply here: https://wearetogetherprize.com/
#social_help#medicine#donorship#healthcare#emergencies
🔜The fifth season of the International Prize #WEARETOGETHER has been launched. Foreign citizens and NGOs can apply until June 23, 2025 on the official website of the Prize.
The Prize is available for volunteers and NGOs from across the globe. The laureates will receive a cash prize valued at $10,000 and an invitation to take part in the International Forum of Civil Participation #WEARETOGETHER, which is traditionally held in December in Moscow.
Prize nominations:
✔️“Sustainable Future”
For those who are leading projects in the field of environmental protection, environmental education, ecological consumption, “green” economy and technologies
#ecology#urbanism#biodiversity#recycling#environmental protection
✔️ “Human Assistance”
For those who run projects aimed at improving the well-being of vulnerable categories of citizens, providing social and humanitarian assistance to people, discovering talents and nurturing individuals, developing education and volunteerism.
Apply here
#social_help#medicine#donorship#healthcare#emergencies