TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 31 слични објави

Пребарај: #discovery

当前筛选 #discovery清除筛选
SweetShare Channel

@SweetShareChannel · Post #316 · 19.08.2022 г., 13:37

//SweetShare共享请求: 平台:#Discovery+ 价格:36/半年/人 备注:Discovery+ 美区无广告计划,5人车差4人(实际4人车)。独立profile,有BBC蓝色星球,荒野求生、流言终结者等各种自然、科技、历史、美食、灵异等节目。生肉无中字,需美国节点,半年付36,如果内购涨价翻车按比例退,跳车不退 车牌:粤T7EAF4 上车请联系:@SweetTicketsBot

Hashtags

SweetShare Channel

@SweetShareChannel · Post #302 · 11.08.2022 г., 04:43

//SweetShare共享请求: 平台:#Discovery 美区无广告 价格:30/季/人 季度付款 备注:🇺🇸美区无广告计划,5人车差3人。独立profile,有BBC蓝色星球,荒野求生、流言终结者等各种自然、科技、历史、美食、灵异等节目。生肉,需美国节点,季度付款30,前一季度为90+7(试用天),跳车不退,翻车退尾款 车牌:吉YY27Q1 上车请联系:@SweetTicketsBot

Hashtags

SweetShare Channel

@SweetShareChannel · Post #213 · 04.07.2022 г., 03:34

//SweetShare共享请求: 平台:#Discovery+ 价格:36/半年/人 备注:🇺🇸美区无广告计划,5人车差2人(实际4人车),可同时4屏观看。独立profile,有BBC蓝色星球,荒野求生、流言终结者等各种自然、科技、历史、美食、灵异等节目。生肉无中字,需美国节点,翻车比例退,跳车不退 车牌:新XX0BR5 上车请联系:@SweetTicketsBot

Hashtags

SweetShare Channel

@SweetShareChannel · Post #74 · 30.05.2022 г., 01:19

//SweetShare共享请求: 平台:#Discovery+ 🇺🇸美区无广告计划 价格:38元/半年/人 联系:@richbrch 备注:5人车差4人,独立profile,有BBC蓝色星球,荒野求生、流言终结者等各种自然、科技、历史、美食、灵异等节目。生肉,需美国节点,跳车不退。

Hashtags

Amazing Geography 🌍

@amazingeo · Post #638 · 17.02.2026 г., 20:31

🌍 In 2023, explorers finished mapping over 75% of the world’s seafloor in high detail, uncovering thousands of undersea mountains and canyons hidden beneath the oceans. ✨ #exploration⚡#mapping⚡#discovery⚡#geography⚡#nature⚡#earth 👉subscribe Amazing Geography 👉more Channels ​

Amazing Geography 🌍

@amazingeo · Post #183 · 05.09.2025 г., 20:12

🌍 Over 80% of Earth’s ocean remains unmapped and unexplored by humans. Modern sonar and robotic submersibles are revealing new mountains, trenches, and species with every deep-sea journey. ✨ #exploration⚡#ocean⚡#discovery⚡#geography⚡#nature⚡#earth 👉subscribe Amazing Geography🌍 ​

Amazing Geography 🌍

@amazingeo · Post #258 · 18.09.2025 г., 09:12

🌍 The first map to show the Americas as a separate continent was made by German cartographer Martin Waldseemüller in 1507. It’s where the name “America” first appeared on a world map. ✨ #cartography⚡#history⚡#discovery⚡#geography⚡#nature⚡#earth 👉subscribe Amazing Geography🌍 ​

Amazing Geography 🌍

@amazingeo · Post #681 · 03.04.2026 г., 20:31

🌍 In 2022, explorers used sonar to map a hidden undersea volcano off Madagascar’s coast, revealing a peak 800 meters tall that was completely unknown before their expedition. ✨ #exploration⚡#discovery⚡#oceans⚡#geography⚡#nature⚡#earth 👉subscribe Amazing Geography 👉more Channels ​

Interesting Planet 🌍

@interesting_planet_facts · Post #990 · 30.10.2025 г., 22:11

🌎 While mapping the ocean floor in 1947, researchers aboard HMS Challenger discovered the Mid-Atlantic Ridge, revealing Earth's largest mountain range hidden underwater. This seismic finding triggered the theory of plate tectonics—explaining how continents drift. The ridge stretches for over 16,000 kilometers beneath the Atlantic Ocean. ✨ #discovery⚡#geology⚡#oceanography 👉subscribe Interesting Planet 👉more Channels ​

ПретходнаСтраница 1 од 3Следна