TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 8 слични објави

Пребарај: #robertdeniro

当前筛选 #robertdeniro清除筛选
Киноцентр "ДомЖур"

@kino_domjour · Post #5537 · 05.05.2026 г., 14:11

⠀ 😎Аль Пачино и Роберт Де Ниро в совместной рекламной кампании Moncler, приуроченной к 50-летию их профессиональной и личной дружбы, 2025 ⠀ #АльПачино#РобертДеНиро#AlPacino#RobertDeNiro

Киноцентр "ДомЖур"

@kino_domjour · Post #4729 · 17.10.2025 г., 08:59

⠀ Мартин Скорсезе и Роберт Де Ниро на кадре из фильма «Таксист», 1976 ⠀ 👉🏻 В этом году выйдет документальный сериал о режиссере «Мистер Скорсезе». 👉🏻 Следующей картиной самого Скорсезе станет детективный триллер «Что происходит ночью» с Леонардо ДиКаприо и Дженнифер Лоуренс. ⠀ #МартинСкорсезе#MartinScorsese#РобертДеНиро#RobertDeNiro

Киноцентр "ДомЖур"

@kino_domjour · Post #4087 · 20.05.2025 г., 14:05

⠀ ⭐️Аль Пачино и Роберт Де Ниро на съемках фильма «Крестный отец 2», 1974 ⠀ 👉🏻 Еще до первого «Крестного отца» Коппола хотел снять фильм, в котором собирался показать отца и сына в одном и том же возрасте. В отце он хотел увидеть черты его будущего сына, а в сыне – черты отца. ⠀ #АльПачино#РобертДеНиро#RobertDeNiro#AlPacino#Крёстныйотец#TheGodfather

Видеотека 📼

@videotekashow · Post #14096 · 30.07.2025 г., 17:03

Различные варианты постеров к фильму Джона Франкенхаймера «Ронин». #ВИДЕОТЕКА #Ronin #Ронин #РобертДеНиро #RobertDeNiro #ЖанРено #JeanReno

Видеотека 📼

@videotekashow · Post #15857 · 26.03.2026 г., 15:14

Еще один стильный альтернативный постер к «Схватке» Майкла Манна. #ВИДЕОТЕКА #Heat #Схватка #RobertDeNiro #РобертДеНиро #AlPacino #АльПачино #MichaelMann #МайклМанн

Видеотека 📼

@videotekashow · Post #15119 · 15.12.2025 г., 17:47

🎬📷 Атмосферные фото со съёмок фильма «Схватка». В этот день ровно 30 лет назад шедевр Майкла Манна вышел на большие экраны. #ВИДЕОТЕКА #Heat #Схватка #RobertDeNiro #РобертДеНиро #AlPacino #АльПачино #ValKilmer #ВэлКилмер #MichaelMann #МайклМанн #AshleyJudd #ЭшлиДжадд #TomSizemore #ТомСайзмор #BehindTheScenes

Видеотека 📼

@videotekashow · Post #14238 · 17.08.2025 г., 18:33

«Если Марти попросит меня о чем-то, я буду думать об этом всерьез — даже если это покажется мне неинтересным». Сегодня Роберту Де Ниро исполнилось 82 года. #ВИДЕОТЕКА #RobertDeNiro #РобертДеНиро #TheGodfatherPartII #КрестныйОтец2 #TheDeerHunter #ОхотникНаОленей #RagingBull #БешеныйБык #OnceUponATimeInAmerica #ОднаждыВАмерике #MidnightRun #УспетьДоПолуночи #Casino #Казино #Heat #Схватка #Ronin #Ронин #TheIntern #Стажер #TheIrishman #Ирландец