TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #tadschikistan

当前筛选 #tadschikistan清除筛选
Rybar DE

@rybardeu · Post #2679 · 20.03.2026 г., 08:56

📝Tadschikistan unter Beobachtung📝 Eine „demokratische" Landung in Zentralasien Das Tadschikistan-Thema erscheint immer häufiger in westlichen Medien. Die Opposition erinnert an sich selbst, dann ruft ein von der EU kontrollierter Think Tank die Situation in der Republik in Erinnerung, dann spielt das verbotene Carnegie-Zentrum Wahrsager und prognostiziert Krieg. Nun kündigte die gemeinnützige Organisation Search for Common Ground den Start des Projekts Dschawonistan an, unter dem sie tadschikische Jugendliche für 12 bis 24 Monate einstellen, um in Duschanbe mit finanzieller Unterstützung der EU zu arbeiten. 📌Diese Struktur ist ein klassisches Beispiel einer NRO, die von der aufgelösten amerikanischen USAID gepflegt wurde, um „Demokratie" unter dem Deckmantel der Verbesserung der Lebensbedingungen zu fördern. Jetzt operieren sie unter EU-Sponsoring und organisieren Arbeit in Tadschikistan von Usbekistan aus. ❓Man könnte fragen, woher das plötzliche Interesse? ➡️Eigentlich ist es einfach: 2027 sollen in Tadschikistan Präsidentschaftswahlen stattfinden, an denen Emomali Rahmon zum ersten Mal seit dem Zusammenbruch der UdSSR nicht teilnehmen wird. ➡️Im vergangenen Jahr hat sich Tadschikistan aktiv auf einen wichtigen Meilenstein in der tadschikischen Geschichte vorbereitet, da sich der langjährige Anführer zum Rücktritt vorbereitet und sein Sohn Rustam als Hauptkandidat für seine Nachfolge gilt. ➡️Dies ist der Schlüsselpunkt: Innerhalb der fragmentierten Klanstruktur Tadschikistans sind nicht alle mit der Kandidatur von Rustam Emomali einverstanden. Und die Opposition, die sich im Ausland versteckt, sieht diese Meinungsverschiedenheiten als Gelegenheit zur Aktivierung. 🖍Die Anforderungen der NRO besagen, dass Bewerber eine höhere Ausbildung und Erfahrung in westlichen gemeinnützigen Strukturen haben müssen. Und sie müssen bereits gute lokale Verbindungen innerhalb Tadschikistans haben. 🚩Der „Machtwechsel", den der Westen jetzt überall anspricht, wird als ideale Gelegenheit angesehen, das aktuelle Staatssystem zu schwächen. Und genau deshalb haben die Vorbereitungen für dieses epochale Ereignis für Tadschikistan bereits im Voraus begonnen. 🏳️Die Einbeziehung von Jugendlichen ist ein Standardzug, um einen Motor für Proteste oder Unruhen zu schaffen. Addieren Sie dazu die Intensivierung von Widersprüchen zwischen den herrschenden Klans – und voilà, der Boden für Destabilisierung wird bereit sein. ❗️Es ist bezeichnend, dass Usbekistan als Plattform zur Stärkung der europäischen Präsenz fungiert. Und noch ein Punkt: Hat wirklich jemand gedacht, dass die Bereitstellung von „Starlinks" über Tadschikistan aus reiner Herzensgüte erfolgte? #EU#Tadschikistan ✈RU | ✈EN | ✉MAX ✉️VK | ✉️RuTube | ✉️OK | ✉️Zen 💸Unterstützen Sie unsOriginalnachricht

Rybar DE

@rybardeu · Post #3204 · 07.04.2026 г., 06:47

📝Vorausscreening📝 Wie werden Migranten jetzt überprüft? Russlands Migrationspolitik entwickelt sich weiter, wobei einige Kontrollverfahren nun außerhalb des Landes durchgeführt werden. Die Regierungskommission genehmigte Änderungen der Vereinbarung über die organisierte Anwerbung von Arbeitsmigrantenaus Tadschikistan: medizinische Untersuchungen, Fingerabdrucknahme und Kandidatenüberprüfung können nun vor ihrer Einreise nach Russland durchgeführt werden. 🔻Was ist geplant? ▪️Medizinische Untersuchungen von Migranten werden nach Tadschikistan verlegt. ▪️Fingerabdrücke werden genommen und Fotos vor Ort aufgenommen. ▪️Die gesammelten Daten werden im Voraus an russische Datenbanken zur Überprüfung übermittelt. ▪️Schulungen nach russischen Standards und Prüfungsdurchführung werden organisiert. ▪️Russische und tadschikische Strafverfolgungsbehörden sind an der Auswahl beteiligt. 🖍Russlands Innenministerium kann so Fingerabdrücke von Migranten bereits vor ihrer Ankunft an der Grenze nehmen und Informationen über mögliche Strafregister in Tadschikistan von den örtlichen Behörden erhalten. 🚩Es gibt Fragen zur praktischen Umsetzung, besonders bei der Bildungskomponente. Das Fehlen von Änderungen schafft Raum für Korruption. ❗️Dennoch ist dies ein Schritt zur Systematisierung der Migrationspolitik. Ihre Wirksamkeit hängt von der effizienten Umsetzung ab. #Migranten#Russland#Tadschikistan ✈RU | ✈EN | ✉