TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 377 слични објави

Пребарај: #set

当前筛选 #set清除筛选

Кто помнит как мы дэнсили под Dj Hang Aoki в Комбинате? Так вот, у команды клуба Комбинат и комьюнити ПЛЮР вышел первый микс (PLURMIX)! Он был записан при участии берлинской диджейки Hang Aoki на ивенте EMM: BERLIN EDITION 24-го мая. Триповые звуки и бесконечный грув, который остался в сердечке у тех кто был на ивенте. А кто не был, то вот это отличный шанс заценить добротный селекшн от Aoki и хоть немного ощутить, то что мы испытывали на танцполе тогда! Доступно к прослушиванию в >>>YouTube<<< и >>>Soundcloud<<< (*запрещен в КР) _ #dj#set @BishDvizh

Hashtags

Проект СЕТ — пространство, где оживают мечты о красивой жизни. Сегодня хочу рассказать вам историю уникального проекта на западе Москвы, в зеленом Можайском районе, рядом с престижным Кутузовским проспектом. Когда только начиналась работа над СЕТ, ставили одну цель — сделать не просто здание, а создать точку притяжения для новых историй, где каждый житель чувствует себя частью чего-то большего. Так и получилось. Окружение — ваш первый выбор: 10 минут до МКАДа, 15 до ТТК и всего 20 минут пешком до метро Давыдково. Отличная транспортная доступность, но при этом — зелёная, спокойная атмосфера. 💫Три корпуса переменной высоты — 18, 45 и 59 этажей — стали стильной городской доминантой. Их ломаная геометрия отсылает нас к творчеству русских авангардистов, а огромные панорамные окна наполняют квартиры светом и открывают завораживающие виды на парки и городские панорамы. Продумали всё для вашего комфорта: — На территории комплекса вас ждёт водоём, напоминающий лесное озеро — идеальное место для восстановления сил; — Лаунж-зона с террасами для уютных встреч, бесед и завтраков на свежем воздухе; — Площадки для йоги и воркаута для активных жителей; — Современные переговорные и комнаты для мероприятий — ваш личный home office или арт-пространство для праздников; — Безопасные игровые площадки для малышей и подростков, чтобы родители могли наслаждаться отдыхом, зная, что дети в безопасности. Жизнь в СЕТ — это свобода выбирать СВОЙ сценарий, ведь проект предлагает разные планировки по привлекательной цене: — Студии с панорамными окнами — от 10 690 000 ₽ — Однокомнатные квартиры — от 14 110 000 ₽ — Двухкомнатные квартиры — от 18 860 000 ₽ — Трёхкомнатные квартиры — от 27 160 000 ₽ Здесь найдётся место для каждого: уединённая студия для самостоятельных и всегда занятых, семейные апартаменты с просторной террасой для дружных завтраков и вечеров с друзьями. 💫Ваша квартира в СЕТ — не просто комфорт. Это умное вложение в будущее, в недвижимость, спрос на которую только растёт. Я помогу вам сделать грамотный выбор и сохранить, и приумножить ваши инвестиции. Напишите мне в чат — расскажу подробнее о планировках, этапах строительства и возможностях для вас! 💫 #недвижимостьмосква#купитьквартиру#SET

123•••10•••20•••303132
ПретходнаСтраница 1 од 32Следна