Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
#To‘lov madaniyati
Hurmatli iste'molchilar! Foydalanilgan ichimlik suvi hamda ko‘rsatilgan oqova suv xizmati uchun to‘lovlarni o‘z vaqtida amalga oshirishni unutmang! Iste'molchilik burch va majuriyatingizni namunali ado etish orqali soha taraqqiyotiga hissa qo‘shgan bo‘lasiz.
Nafaqat, o‘z uyingizda, balki, ota-onangiz, aka-ukangiz, opa-singlingiznikida ham ichimlik suvi muntazam oqib turishini xohlasangiz to‘lov madaniyatiga rioya qiling!
"Andijon suv ta'minoti" AJ axborot xizmati
|Website|
🗝Cabinet
|🤖Bot|😄Telegram
|
💬Facebook|
🌐Instagram
|
📹YouTube |
🕊X
|💬Chat |
✅TikTok
#To‘lov madaniyati
Izboskan tumanida iste’molchilarga qulaylik yaratish maqsadida to‘lovni markazlashgan holda qabul qilish ishlari amalga oshirilmoqda. Bunda zarur texnik vositalar o‘rnatilgan bo‘lib, shuningdek, to‘lovning onlayn usulidan keng foydalanilayapti.
"Andijon suv ta’minoti" AJ axborot xizmati
|Website|
🗝Cabinet
|🤖Bot|😄Telegram
|
💬Facebook|
🌐Instagram
|
📹YouTube |
🕊X
|💬Chat |
✅TikTok
#To‘lov madaniyati
“Hududiy elektr tarmoqlari” Andijon hududiy filialida foydalanilgan ichimlik suvi hamda ko‘rsatilgan oqova suv xizmati uchun to‘lovlarni markazlashgan holda qabul qilish ishlari davom etmoqda. Bu yerda yaratilgan sharoit ishchi-xodimlarning vaqtini tejab, to‘lovni o‘z vaqtida amalga oshirishlari uchun qulay imkoniyat yaratmoqda.
"Andijon suv ta’minoti" AJ axborot xizmati
|Website|
🗝Cabinet
|🤖Bot|😄Telegram
|
💬Facebook|
🌐Instagram
|
📹YouTube |
🕊X
|💬Chat |
✅TikTok
#To‘lov madaniyati
Avval xabar berganimizdek, “Hududiy elektr tarmoqlari” Andijon hududiy filialida foydalanilgan ichimlik suvi hamda ko‘rsatilgan oqova suv xizmati uchun to‘lovlarni markazlashgan holda qabul qilish ishlari davom etmoqda. Tashkilot ishchi-xizmatchilari tomonidan to‘lovlarni amalga oshirish uchun barcha zarur sharoitlar yaratildi. To‘lovlarni qabul qilish uchun maxsus texnik vositalar o‘rnatilib, jarayon “Andijon suv ta'minoti” AJ mas'ullari tomonidan nazoratga olinmoqda.
"Andijon suv ta'minoti" AJ axborot xizmati
🌐Website|
🗝Cabinet
|🤖Bot|😄Telegram
|
💬Facebook|
🌐Instagram
|
📹YouTube|
🕊X
|💬Chat|
✅TikTok
#To‘lov madaniyati
Hurmatli iste'molchilar! Foydalanilgan ichimlik suvi hamda ko‘rsatilgan oqova suv xizmati uchun to‘lovlarni o‘z vaqtida amalga oshirishni unutmang! Iste'molchilik burch va majuriyatingizni namunali ado etish orqali soha taraqqiyotiga hissa qo‘shgan bo‘lasiz.
Nafaqat, o‘z uyingizda, balki, ota-onangiz, aka-ukangiz, opa-singlingiznikida ham ichimlik suvi muntazam oqib turishini xohlasangiz to‘lov madaniyatiga rioya qiling!
"Andijon suv ta'minoti" AJ axborot xizmati
|Website|
🗝Cabinet
|🤖Bot|😄Telegram
|
💬Facebook|
🌐Instagram
|
📹YouTube |
🕊X
|💬Chat |
✅TikTok
#to.be.going.to
#will
@fluencyinenglish
🔵تفاوت بین will و be going to
۱. اگر قصد بیان یک نقشه قبلی، یعنی چیزی که از قبل برای آن مقدمهچینی و برنامهریزی کردهایم، داشته باشیم، فقط باید از be going to استفاده کنیم. به عنوان مثال، مکالمه زیر را در نظر بگیرید:
A: Why did you buy this paint?
B: I’m going to paint my bedroom tomorrow.
@fluencyinenglish
در این مکالمه، گوینده A یک نقشه قبلی دارد. در واقع، هفته پیش او تصمیم گرفته است که اتاق خوابش را رنگ کند. او میخواهد فردا آن را رنگ کند. به یک مثال دیگر توجه کنید:
A: Are you busy this evening?
B: Yes. I’m going to meet Jack at the library at seven. We’re going to study together.
در این وضعیت، فقط باید از be going to استفاده کنیم؛ چون گوینده B از قبل برای درس خواندن برنامهریزی کرده است؛ پس برای بیان یک نقشه قبلی در زمان آینده، نباید از will استفاده کنیم.
۲. اگر قصد بیان رضایت و میل در زمان آینده را داشته باشیم، باید از will استفاده کنیم. مثال زیر را در نظر بگیرید:
A: The phone’s ringing.
B: I’ll get it.
@fluencyinenglish
در این مکالمه، گوینده B میگوید که «من مایلم و خوشحالم میشوم که تلفن را بردارم». او از قبل در کمین جواب دادن به تلفن ننشسته است. در واقع او در همان لحظه زنگ خوردن تلفن تصمیم میگیرد که تلفن را بردارد. به عنوان یک مثال دیگر، مکالمه زیر را در نظر بگیرید:
A: I don’t understand this problem.
B: Ask your teacher about it. She’ll help you.
در این مکالمه، گوینده B درباره رضایت و میل معلم برای کمک کردن به گوینده B مطمئن است؛ بنابراین استفاده از be going to در اینجا مناسب نیست و باید از will استفاده کنیم.
@fluencyinenglish
میتوان گفت که will برای بیان تصمیماتی که در همان لحظه گرفته میشود، به کار میرود. به عنوان یک مثال ساده، فرض کنید یکی از دوستانتان شما را در خیابان میبیند و از شما میپرسد که کجا دارید میروید و شما میگویید که مثلاً دارید به سینما میروید. آنگاه اگر ایشان بخواهد بگوید که با شما میآید، باید از جمله
I’ll come, too
استفاده کند؛ چون این تصمیم را بدون برنامهریزی قبلی و در همان لحظه گرفته است.
@fluencyinenglish
در پایان به راحتی میتوان نتیجه گرفت که نوشتن جملههایی مثل
In Section 2 we will prove that…
در مقالههای انگلیسی از لحاظ گرامری، درست نیست؛ چون معنی این جمله میشود: «همین الان و بدون برنامهریزی قبلی، تصمیم گرفتیم که در بخش ۲ هم ثابت کنیم که…».
@fluencyinenglish