TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 5 слични објави

Пребарај: #freeassange

当前筛选 #freeassange清除筛选

Сегодня - день рождения Джулиана Ассанжа. К сожалению, этот достойный человек совсем пропал из информационной повестки. "Люди преданы до тех пор, пока не увидят прямой выгоды в отречении от преданности". #FreeAssange

Hashtags

24 февраля в Великобритании в судебном порядке будет рассмотрен вопрос об экстрадиции создателя портала WikiLeaks австралийского - журналиста Джулиана Ассанжа в США. Там его ждут несколько пожизненных сроков – 175 лет заключения. Правительство США обвиняет Ассанжа в шпионаже путем журналистской деятельности за два эпизода: публикацию материалов, подтверждающих совершение американскими военными преступлений против мирного населения в Ираке и Афганистане (эта же информация была опубликована в ряде крупнейших американских изданий, но крайним оказался именно Ассанж), а также вмешательство в выборы президента США в сговоре со спецслужбами России и командой Дональда Трампа. С весны 2019 года в ожидании решения об экстрадиции Джулиан Ассанж находится в лондонской тюрьме Белмарш. Осенью 2019 года на слушания в Европарламенте специальный докладчик ООН по пыткам Нильс Мельцер заявил, что в отношении журналиста применяются пытки. #FreeAssange

Hashtags

Человеку чести, борцу за правду Джулиану Ассанжу грозит в прямом смысле слова смертельная опасность. Британский суд отказался отложить до следующего года рассмотрение дела об его экстрадиции. В случае принятия судом решения об экстрадиции в США Ассанжу грозит 175 лет тюрьмы. Запрос о переносе слушаний направили адвокаты основателя #WikiLeaks «Слушания по делу об экстрадиции Ассанжа возобновили накануне в Лондоне. Они должны были начаться еще в мае, но из-за коронавируса COVID-19 заседания пришлось перенести. Австралиец впервые за последние месяцы присутствовал на слушаниях лично. Напомним, американский минюст обвиняет Джулиана Ассанжа в шпионаже и раскрытии секретной информации. #FreeAssange

Savino Balzano

@savinobalzano · Post #551 · 31.01.2024 г., 09:38

Le immagini di Ilaria Salis in catene indignano, giustamente. Non pensate, però, che una certa informazione e, ovviamente, una certa politica stiano strumentalizzando la vicenda? A nessuno frega assolutamente nulla dei carcerati italiani: le nostre strutture detentive toccano picchi di sovraffollamento superiori al 120% e registriamo una media di un suicidio ogni 5 giorni. Oppure, perché nelle anteprime dei telegiornali non sento alcuna indignazione in merito ad altri casi? Mi viene in mente quello di Julian Assange, detenuto nei civilissimi Stati Uniti dove la libera informazione ovviamente è assolutamente preservata… La mia al TG Plus di Cusano Italia TV #IlariaSalis#IlariaSalislibera#Salis#Assange#JulianAssange#FreeAssange https://www.youtube.com/watch?v=Ce4uW82doAQ&ab_channel=SavinoBalzano

Savino Balzano

@savinobalzano · Post #684 · 27.06.2024 г., 07:50

Solo 6 secondi: ascoltateli. @StefanoFeltri riesce a paragonare #JulianAssange a Matteo Messina Denaro. Si potrebbero dire tante cose, davvero molte, ma credo che in certi casi non serva. L'unica cosa che mi sento di dire è questa: per #Assange si è mobilitato il mondo e sono tantissime le persone che lo ammirano e che gli esprimono gratitudine per quello cha ha fatto. Sarebbe facile, poi, paragonare la sua figura a quella di Feltri per evidenziare l'assoluta nullità della seconda, ma non lo facciamo và, che tanto Feltri ormai non se lo fila nessuno. Ve le immaginate voi le gigantografie con la faccia di Stefano Feltri esposte dagli edifici pubblici di mezzo globo? gigantografie con l'hashtag "FreeFletri"? No vero? Certo che no, a lui non potrebbe mai accadere: e non perché non sa essere scomodo al potere, ci mancherebbe altro! cosa andate a pensare?! Semplicemente perché Stefano è una brava persona: non è mica come Messina Denaro lui! #FreeAssange#FreeAssangeNOW#AssangeFree#AssangeWalksFree https://x.com/SavinoBalzano/status/1806232727689015716?t=yv213CFSo3XeBBlnYF1nGA&s=19