TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #save12

当前筛选 #save12清除筛选
(葵涌邨)梁錦威資訊頻道

@kc_leungkamwai · Post #1110 · 23.10.2020 г., 09:20

今個星期一至五,都要到區議會開會。在區議會,要跟進地區問題、政策缺陷、議會運作、撥款運用等等,正如 譚家浚Warren Tam 所講,都幾吃力。 作為民主派區議員,是承載著抗爭及變革的民意而進入議會。面對政權的打壓,區議會係咪無用,係視乎大家的抗爭意志。 除了家浚,Henry Sin 冼豪輝、劉子傑LCK Chris 都是我今個星期見足五日的議員同事😭 今個星期的議會工作,會盡快向大家匯報🙇🏻🙏 --------------------------------- 12位手足仍在中國身陷囹圄,現況不明。 李宇軒 張俊富 張銘裕 嚴文謙 李子賢 郭子麟 鄭子豪 廖子文 黃臨福 鄧棨然 黃偉然 喬映瑜 懇請大家繼續關注12位手足的安危,參與10月25日(星期日)晚上8時「 12港人關注組」舉辦的網上集會。 鳴謝 黃之鋒Joshua Wong印製「#SAVE12」透明卡,街坊可到我們辦事處索取,把十二位手足的名字,帶到香港每一處: https://www.facebook.com/....../a.12....../1507692932761959/ #SAVE12 #SAVEHK12YOUTHS #1025網上集會 #BringThemBack

Hashtags

港島西。Channel

@islandwest84 · Post #39315 · 27.07.2022 г., 00:03

然媽媽: 呢封信第二次打回頭,冇呢個人,好擔心佢 同一封信,寄咗兩次,都話無人領取!!! 姐係點,第一次當寫錯地址,第二次係咩原因?😭😭😭😭 打完電話又話要問,叫我等。 唔通真係要上訪? #save12#save12hkyouths#鄧棨然#bringthemallback yanlegobrother

香港網軍

@deathto50cents · Post #9414 · 25.10.2020 г., 09:48

十二非數字,十二絕非罪。 暴風雷雨聲,痛苦掙扎中。 我們不沉默,我們不被動。 輕輕帶回去,安全帶回家。 ⁃ 閣地們的 #詩 #SAVE12#1025網上集會#Save12HKYouths#StandWithHongKong #BringThemBack www.instagram.com/kokdamon/

(葵涌邨)梁錦威資訊頻道

@kc_leungkamwai · Post #1102 · 20.10.2020 г., 11:19

【把十二位手足的名字,帶到香港每一處。】 街坊可以到本處領取「#SAVE12」透明卡。 這是我們,也是他們的家,肉身雖被困,就把能象徵他們的東西帶到香港每一處。 #BringThemBack ——— 🔸拿到文宣的香港人,可手持透明卡在香港各處拍攝,並Hashtag 「#SAVE12」、「#SAVEHK12YOUTHS」和「#1025網上集會」後上傳至社交媒體。 透過這款「#SAVE12」透明卡,把這12個名字牢牢記在心裡,同時把這12個名字帶到香港的每一處,也透過這行動讓12港人家屬能感受我們的支持。 🔸藉此呼籲公眾毋忘十二手足,以及提醒大家在10月25日(星期日)晚上參與「12港人關注組」所舉辦的網上集會。 我們都在想念你們 香港人等你回家 願十二人平安歸來 鳴謝 黃之鋒 Joshua Wong 印製「#SAVE12」透明卡 #毋忘義士#釋放十二 #save12hkyouths