TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 51 слични објави

Пребарај: #netherlands

当前筛选 #netherlands清除筛选
De Nieuwshoorn

@Nieuwshoorn · Post #52735 · 24.01.2026 г., 13:28

🇳🇱 Amsterdam, #Netherlands. Dutch Authorities are conducting a manhunt for someone who started a Fire at Central Station. This migrant is seen on CCTV released by Dutch Politie lighting a fire on a train and another at Amsterdam Central Station. Obviously he's an engineer, testing how fireproof things are. Follow us -> LiveLeak

Hashtags

POPULAR FRONT

@popularxfront · Post #6200 · 08.05.2026 г., 16:50

🇳🇱#Netherlands: A firework bomb was thrown through the mail slot of D66’s headquarters in The Hague yesterday, causing an explosion during a meeting of the youth wing of the progressive liberal party. A 37-year-old man was arrested following the incident, but Dutch police have not released any further details. The same headquarters were also targeted in September last year during a right-wing rally, when alleged football hooligans smashed the building’s windows and set fire to a police car near the offices. (via Dutch News & Reuters)

Hashtags

International Geographic

@internationalgeographic · Post #5652 · 02.05.2025 г., 03:12

Leiden, #Netherlands In terms of the number of canals, Leiden in the Netherlands is second only to Amsterdam. There are 28 km of "waterways" here. A boat trip is a must–have entertainment for tourists, because many of the canals are like full-flowing rivers. The city's largest canal is the Rapenburg

Hashtags

Voyage.Travel.Tourism

@VOYAGE · Post #792 · 07.03.2024 г., 13:03

Netherlands, Marken Island 🇳🇱 Closer to the western shore of the Markermeer lake in the Netherlands lies the picturesque island of Marken. Its population is only about 2000 people, but these are individuals who live here permanently; few locals leave the island for good. And how could one leave such a magical place, where a fairytale atmosphere reigns in a genuine fishing village, where wooden houses on stilts look like they've come straight out of pictures, and where there are practically no cars to disturb the local museum-like authenticity. 🏡 #Netherlands @voyage

Hashtags

Voyage.Travel.Tourism

@VOYAGE · Post #701 · 08.01.2024 г., 13:04

Netherlands🇳🇱 Summer Nights in Utrecht! Utrecht is one of the loveliest and coziest cities in the Netherlands. 🌆 Unlike the canals in Amsterdam, Utrecht's canals have two levels, and their quays are connected to adjacent houses by passageways. These houses used to serve as warehouses, and goods were transferred directly from barges to the storerooms. Now, these upper levels have been transformed into terraces and cafes. ☕🍽️ #Netherlands @voyage

Hashtags

BAZUKA

@jbazuka · Post #216 · 19.07.2022 г., 09:38

🇳🇱#NetherlandsВ Нидерландах сгорел супермаркет искусственного мяса Picnic, который финансировался Фондом Билла и Мелинды Гейтс ⚠️☝️ 💬 Супермаркет продвигал и поддерживал закон о сокращении выбросов азота и ликвидации, таким образом, фермеров Нидерландов. 💬 Именно из-за этого обвинения в пожаре хотят повесить на фермеров.

Hashtags

BAZUKA

@jbazuka · Post #188 · 13.07.2022 г., 17:48

🇳🇱#NetherlandsГорожане и фермеры в Энсхеде протестуют вместе ⚠️☝️ 💬 Протесты фермеров в Нидерландах не утихают по сей день! И всё это проходит при полном молчании европейских СМИ.

Hashtags

BAZUKA

@jbazuka · Post #168 · 11.07.2022 г., 23:25

🇳🇱#NetherlandsГолландские фермеры паркуют свои тракторы перед зданием Сената в Гааге ⚠️☝️ 💬 Сегодня ожидается больше демонстрантов. В то же время граждане, поддерживающие протест голландских фермеров, перекрывают шоссе. 💬 Также заблокированы несколько центров распределения, а также дороги, кольцевые развязки и мосты.

Hashtags

BAZUKA

@jbazuka · Post #150 · 10.07.2022 г., 14:52

🇳🇱#NetherlandsВ поддержку восстания голландских фермеров вышли ДЕТИ ⚠️☝️ 💬 Даже дети поддерживают работяг против преступной повестки глобалистов по уничтожению сельского хозяйства!

Hashtags

ПретходнаСтраница 1 од 5Следна