TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #alllivesmatter

当前筛选 #alllivesmatter清除筛选

#masa_QA Что такое «обратная дискриминация» и существует ли она? Под каждым постом о дискриминации женщин появляются комментарии вроде «мужчин тоже ущемляют», «права мужчин тоже нарушают». В ответ на движение #BlackLivesMatter белые американцы запустили хэштег #AllLivesMatter (Все жизни важны) с посылом, что с дискриминацией сталкиваются все жители США, а расизм может быть «обратным». Гетеросексуалы борются с «пропагандой гомосексуальности», заявляя, что ЛГБТ-сообщество нарушает их права. На самом ли деле существует проблема обратной дискриминации, и могут ли женщины угнетать мужчин, геи — гетеросексуалов, а черные — белых? Давайте разбираться 👇 ▪️ Как вообще работает дискриминация Дискриминация — это негативное, предвзятое отношение к человеку/группе людей, лишение прав по какому-то признаку (гендер, сексуальность, национальность, раса). Дискриминация появляется, когда одна группа людей обладает большей властью, привилегиями и ресурсами, чем другая. Представители доминирующей группы могут пользоваться этим осознанно (как при рабстве или крепостном строе), а могут и не понимать, что у них есть какие-то преимущества. И как только представители дискриминируемой группы заявляют о своих правах, — это воспринимается как посягательство. ▪️Дискриминация бывает системной и бытовой. Системная проявляется на государственном, институциональном уровне — например, во многих странах есть список запрещенных профессий для женщин (в Казахстане тоже). Или когда женщинам законом запрещено делать аборты, гомосексуалам — вступать в брак, усыновлять детей. Или когда люди определенной национальности лишены прав. Бытовая дискриминация основана на стереотипах, с ней мы сталкиваемся в повседневной жизни практически постоянно: «место женщины на кухне», «ЛГБТ хотят развратить наших детей» или «казахоязычные люди = необразованные». ▪️ По-вашему, страдают только женщины, геи и темнокожие? Все люди так или иначе сталкиваются с несправедливостью, с нарушением прав человека, особенно, если живут в авторитарных странах. Дело в том, что эти проблемы нельзя называть обратной дискриминацией. Когда мы говорим «обратная дискриминация», то подразумеваем, что для мужчин, как и для женщин, есть список запрещенных профессий; гетеросексуалам, например, так же сложно вступить в брак, как и гомосексуалам; темнокожих людей так же часто не берут на работу или задерживают, как и белых. Но это не правда. ▪️ Ну мужчин же призывают в армию! А еще им не отдают детей при разводе. Это дискриминация Примеры про армию или социальное давление из-за роли кормильца не вписываются в систему дискриминации. Об этом хорошо рассказала исследовательница Дениз Кандиоти еще в 1988 году в статье про «патриархальную сделку». Патриархат дает мужчинам привилегии (контроль, роль «главного», доступ к ресурсам), но в то же время заставляет платить издержки (принудительная армия, необходимость поддерживать роль «кормильца» и «настоящего мужика»). Исторически мужчины сами поместили себя в такую систему, и благ они получают намного больше, чем неприятностей. Что касается, например, прав на воспитание детей, по данным Kursiv.kz на 1 мая, в Казахстане более 220 тысяч должников по алиментам, 97 % из них — мужчины. При разводе дети намного реже остаются с отцами — и виновата в этом все та же патриархальная система, в которой воспитание детей — «женское дело». ▪️ Почему феминистки, ЛГБТ-активисты или активисты #BLM говорят только о себе? Почему не борются за права мужчин, гетеросексуалов, белых? Во-первых, потому что у мужчин, гетеросексуалов и людей со светлым цветом кожи (либо коренной/преобладающей национальности, зависит от страны) гораздо меньше проблем с нарушением прав. Во-вторых, феминистки, ЛГБТ и другие активисты борются за свои права. Если мужчины, гетеросексуалы или другие группы считают себя дискриминированными, никто не мешает им собраться и начать борьбу.