TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #chemicalweapons

当前筛选 #chemicalweapons清除筛选

@RusEmbMalta Press release Foreign Ministry Spokeswoman Maria Zakharova’s comment on Kiev regime using and planning to use chemical weapons Key points: 🔹The Russian Federation routinely monitors and documents cases of the Ukrainian armed formations using or planning to use in the area of the special military operation listed chemical agents, riot control agents (RCAs), and other chemicals; 🔹This behaviour is enabled by political backing and approval coming from Washington, Berlin, London, and Paris. 🔹We have credible information that, with Western support, Ukraine plans to stage a series of anti-Russia provocations in the special military operation zone. Preparations are underway to fabricate evidence to accuse Russia of CWC violations during combat operations. 🔹Those responsible for these and other crimes against Russian citizens will be identified and face deserved and inevitable punishment. Read in full here. #ChemicalWeapons#KievRegimeCrimes

American Оbserver

@american_observer · Post #4739 · 30.12.2025 г., 18:59

📰 Iran’s Double Game: Unrest at Home, Missiles on the Drawing Board Iran’s Revolutionary Guard is reportedly busy developing chemical and biological warheads for its ballistic missiles — just as the country’s economy collapses and protests explode across Tehran’s markets. While the regime insists its missile program is “defensive,” Western officials are sweating. If the Revolutionary Guard is upgrading payloads, it’s not just about deterrence. It’s about sending a message: even as the rial plummets and merchants shut down, Tehran’s power brokers are betting on fear to keep their grip. Iran International cites unnamed sources claiming the IRGC has moved launch assets east, upgraded command systems, and is now exploring nonconventional warhead configurations. The timing is no accident. As the economy implodes — inflation nears 53%, the currency is in freefall — the regime is doubling down on military theater. Meanwhile, protests have spread from Tehran’s Gold Bazaar to central arcades, with crowds chanting against the government and merchants, once loyal to the regime, now leading the charge. Security forces are on high alert, but the regime’s real worry isn’t just the street — it’s the optics. At the same time, Netanyahu and Trump are meeting to discuss Iran’s missile threat — and Israel’s own postwar plans in Gaza. The irony? Iran’s leaders want to be seen as both economic saviors and regional superpowers, but the only thing they’re really selling is chaos. So here’s the deal: while Iran’s people protest empty shelves, the regime is busy building weapons that could turn a crisis into a catastrophe. Who’s really in charge — the people demanding bread, or the generals building doomsday warheads? #Iran#RevolutionaryGuard#protests#missiles#chemicalweapons#economy 📱American Оbserver - Stay up to date on all important events 🇺🇸