TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #ielts7

当前筛选 #ielts7清除筛选
Andijan Development Center

@adceducate · Post #9516 · 24.04.2025 г., 10:18

ADC мактабида тайёргарлик ва IELTS 7.0 натижаси! Бизнинг укувчимиз IELTS имтиҳонидан 7.0 балл олиб, ўз меҳнати ва ҳаракати билан катта ютуққа эришди. Бу натижа — ADC мактабидаги сифатли таълим, тажрибали ўқитувчилар ва ўқувчининг узлуксиз ҳаракати самарасидир. Биз ҳар бир укувчимизга ишонамиз ва уларнинг муваффақияти — бизнинг асосий мақсадимиздир. Бизга қўшилинг ва IELTSдан катта натижаларга эришинг! #IELTS#ADCschool#ADCбиланмуваффақият#IELTS7#NatijaBilanFaxrlanamiz +998742281121 📞 +998958505111 | +998742276163 📞 +998742252536 | 📺@admofadc 📱Telegram📱Instagram📱Facebook📱TikTok📱YouTube

Andijan Development Center

@adceducate · Post #9168 · 14.01.2025 г., 10:06

🎉 Hasan va Husanlarni 📝📝📝 imtihonida 7.0 natijaga erishganlari bilan tabriklaymiz! 🏆🎓 🔥 Ushbu yigitlar mehnat va to'g'ri yondashuv moʻjizalar yaratishini isbotlashdi! Ular 🤝ADC taklif qiladigan barcha imkoniyatlardan foydalanib, intensiv tayyorgarlikdan o'tishdi va o'z maqsadlariga erishishdi! 💪📚 💡 Siz ham shunday natijalarga erishmoqchimisiz? Unda sizni 🤝ADC kutmoqda: ✅ Tajribali va ilhomlantiruvchi o‘qituvchilar 👩‍🏫👨‍🏫 ✅ Zamonaviy o‘qitish uslublari 💻📖 ✅ Qulay sharoitlar va qo‘shimcha materiallardan foydalanish imkoniyati 📚 ✅ Har bir bosqichda sizni qo‘llab-quvvatlash 🌟 ✨ Orzularingizni keyinga qoldirmang - 🤝ADC bilan muvaffaqiyatga erishish yo‘lingizni bugundan boshlang! 💼🎯 Biz aynan sizni kutyapmiz! 🙌 Бугуноқ рўйхатдан ўтинг: 📞 742261078 993252536 Telegram: 📺@admofadc 🌟Telegram 🌟Instagram 🌟Facebook 🌟TikTok 🌟YouTube🌐Website #IELTS7#ADC#OrzularRuyobgaChiqadi#KelajakTaʼlimi#BirgalikdaMuvaffaqiyat

Andijan Development Center

@adceducate · Post #9418 · 10.04.2025 г., 05:13

🎉 Ajoyib natija bilan tabriklaymiz! 🎉 Bizning o‘quvchimiz IELTS 7.0 ball to‘plab, a’lo darajadagi natijaga erishdi! 💪🇬🇧📚 Bu shunchaki raqam emas — bu mehnat, intizom va malakali o‘qituvchilarimiz bilan sifatli tayyorgarlikning natijasi. Biz har bir o‘quvchimizning yutuqlari bilan faxrlanamiz — bu biz uchun eng katta mukofot! Agar siz ham yuqori IELTS ballini orzu qilsangiz — bizga qo‘shiling! Keyingi qahramon — bu siz bo‘lishingiz mumkin! 🌟 📍 ADC — xalqaro ta'lim sari yo‘lingiz shu yerdan boshlanadi. #IELTS#IELTS7#AndijonTaraqqiyot#AndijondaInglizTili#IELTSUzbekistan#OquvchilarimizYutug‘i #XorijdaTa’lim

Andijan Development Center

@adceducate · Post #9541 · 18.05.2025 г., 14:14

🎉 Табриклаймиз! 🎉 Биздан таълим олган ўқувчимиз IELTS 7.0 баллни қўлга киритди — бу дунёнинг етакчи университетларига йўл очади! 🌍📚📌 Меҳнат, интизом ва сифатли тайёргарлик ўз самарасини берди!🔥 Унинг муваффақиятида устози Шухрат Низомиддиновнинг ҳиссаси беқиёс! ADC да биз ҳар бир шогирдимиз муваффақиятидан фахрланамиз. Сиз ҳам шундай натижага эришмоқчимисиз? 📲 Бизга қўшилинг — навбатдаги қаҳрамон сиз бўлинг! ☎️ 742261078 Telegram: 📺@admofadc 📱Telegram📱Instagram📱Facebook📱TikTok📱YouTube ⠀ #IELTS#ADCeducation#IELTS7#МуваффақиятҲикаяси#ЧетЭлдаТаҳсил#IELTSUzbekistan#ADCталабалари