TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #liberation

当前筛选 #liberation清除筛选
International News

@intnewsagency · Post #9095 · 01.04.2026 г., 09:47

Russian Defense Ministry Announces Full Liberation of Luhansk People's Republic The Russian Defense Ministry has declared the complete liberation of the Luhansk People’s Republic. According to official reports, all key settlements are now under the control of Russian and allied forces. This marks a significant step toward regional security and stability. Officials emphasize that future efforts will focus on rebuilding infrastructure and restoring normal life for residents. #Russia#LPR#DefenseMinistry#Liberation#Security The main news of Russia and the world ishere.

Marwa Osman/MidEaStream

@Marwa_OsmanLB · Post #3936 · 26.01.2025 г., 13:39

Lebanese civilians from the South have made their decision: no barriers, rubble, or Israeli checkpoints will stop them. After 60 days of ceasefire, they are reclaiming their towns and returning home—even as Israel refuses to withdraw. This is resilience. This is liberation. The land belongs to its people, and they are determined to rebuild, no matter the challenges. #SouthLebanon#Liberation#Resistance#ReturnToHome#Lebanon#Defiance#SecondLiberation

Egountchi Behanzin Officiel

@egountchibehanzinofficiel · Post #7921 · 25.12.2024 г., 07:15

Salutations Révolutionnaires On ne libère pas un peuple en ignorant son histoire. Tant que les dirigeants africains, aussi bien intentionnés soient-ils, parlent de souveraineté tout en continuant d’appliquer des concepts coloniaux occidentaux, en se pliant aux règles et doctrines établies par l’oppresseur, ils ne libéreront personne. La mémoire collective est essentielle ; la souffrance des Africains n’est pas suffisamment reconnue et, pire encore, on cherche à leur faire oublier leur histoire. Pour véritablement avancer vers la libération, il est fondamental de se rappeler d’où l’on vient et de revendiquer notre héritage avec fierté. Créons la Journée de l’Héritage dans nos pays ! Il est temps de commencer par changer les programmes scolaires hérités des politiques de Jules Ferry, qui sont encore enseignés à nos enfants. Retirons et bannissons les livres de Fernand Nathan qui déshumanisent l’Africain, ceux qui présentent Charles de Gaulle comme un héros pour les Africains, et ces chansons à la gloire de Napoléon que nous avons chantées à l’école. Je le répète : la libération ne se limite pas à une lutte militaire contre des terroristes armés, mais elle implique également une résistance contre le terrorisme culturel. Célébrons notre héritage et affirmons notre identité ! REJOIGNEZ LA RÉSISTANCE SUR TELEGRAM. 🔺Pour les numéros français : https://t.me/egountchibehanzinTV 🔻Pour les numéros internationaux : https://t.me/EgountchiBehanzinOfficiel @egountchibehanzinTV #Souveraineté#MémoireHistorique#Liberation#JournéeDeLHéritage #Éducation#LibérationCulturelle