TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #voicesofpeace

当前筛选 #voicesofpeace清除筛选
Noize MC

@NoizeMCOfficial · Post #24 · 04.05.2022 г., 12:18

Мы с Монеточкой и Витей Исаевым снова в пути, тур #VoicesOfPeace в поддержку украинских беженцев продолжается. 5 мая (на данный момент это ЗАВТРА) мы выступим в Таллинне, в Cat House: последние билеты пока ещё в продаже, заходите на наш сайт http://voices-of-peace.live/ — там вы можете купить билет или просто сделать пожертвование, а также узнать все подробности о проекте. Вслед за Таллинном на нашем маршруте: 📍Helsinki, Finland — May, 08 (Ääniwalli) 📍Stockholm, Sweden — May, 11 (Slaktkyrkan) 📍Oslo, Norway — May, 13 (Sentrum Scene) P.S. Хотя русский язык и не имеет в Эстонии официального статуса, в эстонских средствах массовой информации, издающихся на русском языке, используется исключительно написание Таллинн, что обусловлено требованиями Языковой инспекции. На территории России официально установлено написание названия города Таллин. Соответственно, этот вариант написания принят Росреестром (Роскартографией). А умников в комментах я переживу;) (па-пара-па-пара-па-папа)

Noize MC

@NoizeMCOfficial · Post #16 · 15.04.2022 г., 21:15

Наш благотворительный тур #VoicesOfPeace с Лизой Монеточкой продолжается: 21 апреля – Варшава, Progresja 23 апреля – Прага, Palác Akropolis 25 апреля – Берлин, Anomalie Art Club 13 мая – Осло, Sentrum Scene Все билеты в Праге были раскуплены за 2 часа – мы даже не успели сделать официальный анонс! 🇨🇿❤️ В остальных городах пока ещё не закрыты продажи. Купить билет и/или сделать пожертвование можно на сайте http://voices-of-peace.live. Более 4,3 миллионов украинцев вынуждены были покинуть родную страну из-за войны. Многим из них уже некуда возвращаться — их дома уничтожены российскими войсками. Целые города превращены в руины, искалечены десятки миллионов судеб, гибнут ни в чём не повинные люди. Все собранные нами деньги будут перечислены в польский фонд «Fundacja Siepomaga», оказывающий медицинскую, продовольственную, правозащитную и прочую гуманитарную помощь украинским беженцам — старикам, женщинам и детям, лишённым крова и средств к существованию, зачастую не имеющим документов и не владеющим иностранными языками, оказавшимся в незнакомой стране с пустыми руками и неподъёмным багажом боли, страха и отчаяния за спиной. По окончании тура мы представим вам отчёты об оказанной помощи, общую информацию о деятельности фонда можно посмотреть здесь: https://www.siepomaga.pl/en/ukraina За первые два концерта (Рига и Вильнюс) нам с вами удалось собрать 122 000 €! Но даже это ещё не всё — на сегодняшний день к этим деньгам добавились следующие суммы: Варшава – 21 300 евро Прага – 31 100 евро Берлин – 9 800 евро Осло – 7 200 евро То есть прямо сейчас мы с вами уже собрали 191 400 €! Хочу отметить, что мы получаем очень много пожертвований из России — думаю, это важно знать. Я благодарю всех, кто самоотверженно поддерживает наш проект. Я вами горжусь! Особенную благодарность сегодня я хочу выразить нашим организаторам — без вас ничего бы не получилось, ребята! https://instagram.com/yanpopkov https://instagram.com/jegor_zharikof https://instagram.com/motiejusdegree https://instagram.com/ticketshoplv P.S.: в нашей интернациональной команде есть граждане Украины, Латвии, Литвы, Польши, Норвегии, Беларуси, России — и этот список всё ещё расширяется. «Мы все люди, мы все боимся боли и смерти, все хотим счастья для наших близких. Это — наша общая духовная земля. Чем больше людей получат гражданство этой земли духовной, тем вероятнее, что мы сможем рано или поздно очистить нашу землю от зарослей ядовитого сорняка зла…» — это слова киевлянки Насти Травкиной. Подпишитесь на её тг-канал «Настигло»: https://t.me/travkinatxt. Это очень сильно.

Noize MC

@NoizeMCOfficial · Post #63 · 12.09.2022 г., 10:41

Через пару тижнів плануємо показати вам відео з найкращими моментами благодійного туру #VoicesOfPeace по 10 європейським столицям, куди ми вирушили навесні разом з @monetochkaliska і @vityaisayev, щоб допомогти українським біженцям. А поки подивіться лайв "Вуду" зі Стокгольма! Почути цю та багато інших пісень у виконанні всього нашого гурту в повному складі скоро можна буде тут: 🇱🇹 8.10 — Vilnius 🇵🇱 9.10 — Warszawa 🇨🇿 11.10 — Praha 🇩🇪 12.10 — Berlin 🇫🇷 13.10 — Paris 🇬🇧 16.10 — London 🇬🇧 17.10 — London 🇳🇱 19.10 — Haarlem (Amsterdam) 🇩🇪 20.10 — München 🇱🇻 22.10 — Rīga 🇪🇪 23.10 — Tallinn 🇫🇮 24.10 — Helsinki Квитки на сайті noizemc.com #noizemcontour2022

Noize MC

@NoizeMCOfficial · Post #17 · 19.04.2022 г., 17:25

Готовимся к Варшаве! Это уже послезавтра (21 апреля, клуб Progresja). В Праге (23.04) и Берлине (25.04) билетов уже нет, но Таллинн (05.05), Осло (13.05) и Варшава ещё в процессе! Также скоро будут объявлены новые города и даты. Билеты и информация — здесь: voices-of-peace.live Следите за обновлениями. До встречи! #noizemc#monetochka#voicesofpeace#charity#ukraine#refugees#грабли#репетиция#варшава🇵🇱