TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 16 слични објави

Пребарај: #yan

当前筛选 #yan清除筛选
TerDU Yuridik fakulteti

@terdu_yuridik · Post #4489 · 25.12.2025 г., 08:47

#diqqat#hemis#talaba#YAN ❗️Barcha professor-o’qituvchilar va talabalar diqqatiga! ✅ HEMIS AT tizimining oʻqituvchi profilidagi “Yakuniy nazorat” va “Boshqa nazoratlar” menyularidagi “Reyting qaydnomalari”da oʻzgarishlar boʻlishi kutilmoqda. ⚠️ Tizimning endigi chiqariladigan yangi versiyasida (1.4.5) Reyting qaydnomasiga fan boʻyicha talabalarning oʻzlashtirish baholarini bir marta kiritib saqlash masalasi joriy qilinmoqda. Yaʼni bitta qaydnoma bir marta toʻliq toʻldirilib, bir marta saqlanishi mumkin. 🙏 Shuning uchun professor-oʻqituvchilar talabalarning YAN topshiriqlarini toʻliq baholab, barcha talabalar toʻgʻri baholanganiga ishonch hosil qilib keyin tizimning reyting qaydnomasiga kiritishini soʻraymiz. ✅ Talabalardan esa YANgacha bo’lgan barcha nazoratlardan belgilangan baholarni o’zlashtirish hamda YANga o’z vaqtida va tegishli talablarni bajargan holda kirishlari so’raladi. ☄️ Tizimga baholarni kiritish reglament boʻyicha 5 kun ichida faqat bir marta amalga oshirilishi mumkin. Baholar kiritilib saqlangandan soʻng reyting qaydnomasi toʻliq yopiladi. Yopilgan reyting qaydnomasiga qoʻshimcha kiritish va oʻzgartirishlarga ruxsat berilmaydi. ➡️ Barcha professor-oʻqituvchilar va talabalarga yetkazing. 👨‍💻Ps: qoʻshimcha savol, muammo va takliflar boʻyicha @registratorofis_botga murojaat qilishingiz mumkin. ✈️TerDU Registrator ofisi

搜书神器 深夜书屋

@BookLogChannel · Post #451020 · 17.04.2026 г., 10:17

书名:催眠调教大屌体育生帅哥1 文件:简体中文 · TXT · 101KB · 4.3万字 · 12R 统计:420热度 | 442下载 | 3点赞 | 0收藏 评级:0分 (0人) 💬 质量:9.8分 (0人) 标签:#高文博#刘叔#博哥#催眠#体育生#老子#骚逼#JB#肌肉#大胸肌#内裤#阿坤#篮球#猛男#PI#YAN#保安室#裆部#结实 上传:👤StaLovte #预览#NSFW#收藏书籍 📜我喜欢的书籍[416本]

搜书神器 深夜书屋

@BookLogChannel · Post #451035 · 17.04.2026 г., 10:18

书名:篮球肌肉体育生和军人父亲 作者:🔎佚名 文件:简体中文 · TXT · 57KB · 1.6万字 · 17R 统计:391热度 | 78下载 | 4点赞 | 0收藏 评级:0分 (0人) 💬 质量:5分 (0人) 标签:#刘力#PI#YAN#雷霆#刘少华#唐显#雷叔#父亲#父亲的#假阴茎#胸肌#邵明#肌肉#体育生#长袜#结实#内裤#佳琪 #预览#NSFW#收藏书籍 📜我喜欢的书籍[416本]

搜书神器 深夜书屋

@BookLogChannel · Post #451034 · 17.04.2026 г., 10:18

书名:篮球肌肉体育生和军人父亲 作者:🔎佚名 文件:简体中文 · TXT · 57KB · 1.6万字 · 17R 统计:391热度 | 78下载 | 4点赞 | 0收藏 评级:0分 (0人) 💬 质量:5分 (0人) 标签:#刘力#PI#YAN#雷霆#刘少华#唐显#雷叔#父亲#父亲的#假阴茎#胸肌#邵明#肌肉#体育生#长袜#结实#内裤#佳琪 #预览#NSFW#收藏书籍 📜我喜欢的书籍[416本]

搜书神器 深夜书屋

@BookLogChannel · Post #450329 · 16.04.2026 г., 14:31

书名:篮球肌肉体育生和军人父亲沦陷 文件:简体中文 · TXT · 54KB · 1.6万字 · 16R 统计:424热度 | 415下载 | 4点赞 | 0收藏 评级:0分 (0人) 💬 质量:5分 (0人) 标签:#刘力#PI#YAN#JB#雷霆#刘少华#唐显#雷叔#父亲的#父亲#假阴茎#胸肌#邵明#体育生#肌肉#长袜#结实#内裤#佳琪 上传:👤寻茶咕噜咕噜 #预览#NSFW#收藏书籍 📜我喜欢的书籍[292本]

搜书神器 深夜书屋

@BookLogChannel · Post #451145 · 17.04.2026 г., 12:44

书名:调教肌肉小警察 文件:简体中文 · TXT · 239KB · 7万字 · 12R 统计:607热度 | 790下载 | 10点赞 | 2收藏 评级:0分 (0人) 💬 质量:8.6分 (0人) 标签:#程战#jb#赵志伟#雷霆#主人#警犬#李老师#方宇#贱狗#PI#YAN#大马#道具#肛塞#卵蛋#马眼#榨精#叔叔 上传:👤lukecage #预览#NSFW#收藏书籍 📜我喜欢的书籍[488本]

搜书神器 深夜书屋

@BookLogChannel · Post #450456 · 16.04.2026 г., 15:22

书名:驯化游戏 作者:🔎钦原 文件:简体中文 · TXT · 397KB · 11.1万字 · 14R 统计:786热度 | 844下载 | 12点赞 | 2收藏 评级:10分 (1人) 💬 质量:10分 (1人) 标签:#篮球队#岳磊#胡伟#锐哥#JB#小子#方超#PI#YAN#磊子#肌肉#体育生#狼犬#老子#胸肌#球哥#舒服#裤裆#手指 上传:👤sunw #预览#NSFW#收藏书籍 📜我喜欢的书籍[374本]

搜书神器 深夜书屋

@BookLogChannel · Post #451103 · 17.04.2026 г., 12:35

书名:疯狂的硬盘 调教帅哥 更新到_117章 作者:🔎辽宁技术sss 文件:繁体中文 · TXT · 527KB · 14.7万字 · 10R 统计:638热度 | 798下载 | 15点赞 | 0收藏 评级:10分 (1人) 💬 质量:8分 (1人) 标签:#傅青嵩#李枫#解锁#云盘#空间#邵云健#汲天#种嘉#主人#PI#YAN#精币#场景#硬盘空间#战士#优盘#喜欢#帅哥#体育生 上传:👤baita #预览#NSFW#收藏书籍 📜我喜欢的书籍[488本]

搜书神器 深夜书屋

@BookLogChannel · Post #450600 · 16.04.2026 г., 17:25

书名:疯狂的硬盘 调教帅哥 更新到_117章 作者:🔎辽宁技术sss 文件:繁体中文 · TXT · 527KB · 14.7万字 · 10R 统计:636热度 | 786下载 | 14点赞 | 0收藏 评级:10分 (1人) 💬 质量:8分 (1人) 标签:#傅青嵩#李枫#解锁#云盘#空间#邵云健#汲天#种嘉#主人#PI#YAN#精币#场景#硬盘空间#战士#优盘#喜欢#帅哥#体育生 上传:👤baita #预览#NSFW#收藏书籍 📜我喜欢的书籍[62本]

搜书神器 深夜书屋

@BookLogChannel · Post #450622 · 16.04.2026 г., 18:03

书名:球奴 体育生粗口玩虐系列_ doufu整理搬运 作者:🔎钦原 文件:简体中文 · TXT · 482KB · 13.8万字 · 10R 统计:863热度 | 2827下载 | 28点赞 | 4收藏 评级:7.34分 (3人) 💬 质量:6分 (2人) 标签:#男同#JB#姜鹏#张航#YAN#PI#梁彪#老子#昆阳#大猛#杭战#体育生#龙哥#肌肉#爷们儿#哥们儿#训练#乔锋#教练#裤裆#小子 上传:👤allll #预览#NSFW#收藏书籍 📜我喜欢的书籍[216本]

搜书神器 深夜书屋

@BookLogChannel · Post #450408 · 16.04.2026 г., 14:58

书名:球奴 体育生粗口玩虐系列_ doufu整理搬运 作者:🔎钦原 文件:简体中文 · TXT · 482KB · 13.8万字 · 10R 统计:863热度 | 2824下载 | 27点赞 | 4收藏 评级:7.34分 (3人) 💬 质量:6分 (2人) 标签:#男同#JB#姜鹏#张航#YAN#PI#梁彪#老子#昆阳#大猛#杭战#体育生#龙哥#肌肉#爷们儿#哥们儿#训练#乔锋#教练#裤裆#小子 上传:👤allll #预览#NSFW#收藏书籍 📜我喜欢的书籍[367本]

搜书神器 深夜书屋

@BookLogChannel · Post #450373 · 16.04.2026 г., 14:46

书名:猛男军人中邪术沦为性奴 文件:简体中文 · TXT · 163KB · 4.8万字 · 6R 统计:570热度 | 404下载 | 3点赞 | 1收藏 评级:2分 (1人) 💬 质量:10分 (0人) 标签:#王富#项猛#云龙#王朗#JI#BA#爸爸#老子#儿子#王小宝#肌肉#骚狗#寡妇#猛男#猛子#蛊童#老子的#PI#YAN #预览#NSFW#收藏书籍 📜我喜欢的书籍[321本]

12
ПретходнаСтраница 1 од 2Следна