TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #asylum

当前筛选 #asylum清除筛选
Addis Standard

@addisstandardeng · Post #21789 · 21.03.2026 г., 07:03

News: #Israel begins arrests of #Ethiopian asylum seekers, plans to deport 8,000 from April – report Israel has begun arresting Ethiopian #asylum seekers and is preparing to deport thousands starting in April, according to a report by Middle East Eye, citing civil society sources. Human rights groups had previously petitioned Israel’s Supreme Court to block the move, temporarily delaying implementation. However, the court has since upheld the government’s position, allowing deportations to proceed. Gilad Palombo of ASSAF told Middle East Eye that around 8,000 Ethiopian nationals are slated for deportation, including approximately 1,000 from the #Tigray region. Bazi Gete, an Ethiopian-Israeli writer and filmmaker, warned that if deported, Ethiopian asylum seekers could face serious risks, describing their potential return as going back to “a kind of no man’s land.” The planned deportations come amid broader concerns over conditions in Ethiopia….. Read more: https://addisstandard.com/?p=55995

AI & Law

@ai_and_law · Post #474 · 27.12.2024 г., 08:04

Transparency in AI and Asylum Decisions: A Legal Challenge Harvard Law Clinic and Jenner & Block LLP have filed a lawsuit on behalf of Refugees International, seeking transparency into the US Department of Homeland Security’s use of AI in asylum adjudications. The case arises from a Freedom of Information Act (FOIA) request submitted in 2022, which has yet to yield answers. The request focuses on the Asylum Text Analytics (ATA) tool, which uses machine learning to detect "plagiarism-based fraud" in asylum applications. Concerns include the tool’s training methodology, its impact on pro se and non-English-speaking applicants, and whether flagged applications receive fair consideration. Critics warn that unregulated AI use risks compounding systemic biases rather than ensuring fairness. This legal battle underscores the urgent need for transparency in deploying AI tools that affect fundamental rights. How AI operates in life-altering decisions should never remain in the shadows. #AI#Asylum#AIEthics#Transparency#FOIA

America 🇺🇸 News & Politics

@America · Post #10387 · 15.03.2026 г., 05:36

🚨🇺🇸SUPREME COURT UNANIMOUS RULING BACKS IMMIGRATION DEPORTATIONS 🔹 9-0 decision in Urias-Orellana v. Bondi strengthens federal deportation powers ⚖️ 🔹 Justice Ketanji Brown Jackson writes opinion limiting asylum appeal protections 📋 🔹 Courts must defer to Board of Immigration Appeals persecution determinations 🏛️ 🔹 "Any reasonable adjudicator would be compelled to conclude to the contrary" new standard 🔍 🔹 Reaffirms 1992 INS v. Elias-Zacarias precedent tightening asylum rules 📜 🔹 El Salvador family's case denied despite threats from hit men and violence 💔 Massive win for administration deportation agenda! 🚨⚡ #USNews#SupremeCourt#immigration#deportation#asylum @america

小喵的ACG黄油 (重开版)

@xiaomiaogame · Post #3652 · 25.03.2026 г., 01:41

SEQUEL系列 废土之旅三部曲 部分官方中文版(CN) 自2017年发布以来的王道热血RPG SEQUEL正传五部 SEQUEL blight SEQUEL awake SEQUEL colony SEQUEL kludge SEQUEL thirst SEQUEL外传三部 ASYLUM アサイラム L.Depth INNOCENT RULES 作者 #リーフジオメトリ 评分 #优秀 #PC#RPG#足交#joiplay#AopAop#官中 #SEQUEL系列#SEQUEL blight #SEQUEL awake #SEQUEL colony #SEQUEL kludge #SEQUEL thirst #ASYLUM#アサイラム#L.Depth #INNOCENT RULES #废土之旅三部曲 下载地址