TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 6 слични објави

Пребарај: #tensions

当前筛选 #tensions清除筛选
Crypto M - Crypto News

@CryptoM · Post #65353 · 13.04.2026 г., 02:04

🚀 Iranian Official Warns of Potential Response to U.S. Naval Blockade An Iranian official has issued a warning regarding Iran's potential response to a U.S. naval blockade. According to NS3.AI, the official indicated that Iran possesses an unused strategy that could be employed if tensions escalate further. This statement comes amid ongoing geopolitical tensions between the two nations, highlighting the complex dynamics at play in the region. #Iran#US#NavalBlockade#Geopolitics#Tensions#Strategy#MiddleEast

Crypto M - Crypto News

@CryptoM · Post #65095 · 11.04.2026 г., 00:45

🚀 Lebanon and Israel to Hold First Meeting on Ceasefire Talks Lebanon and Israel have agreed to hold their first meeting on Tuesday at the U.S. State Department to discuss a ceasefire and set a date for negotiations. According to BlockBeats, this development marks a significant step towards addressing ongoing tensions between the two nations. #Lebanon#Israel#Ceasefire#Negotiations#USStateDepartment#Tensions

Crypto M - Crypto News

@CryptoM · Post #65350 · 13.04.2026 г., 01:55

🚀 U.S. and Iran Maintain Temporary Ceasefire Amid Tensions U.S. President Donald Trump announced that the temporary two-week ceasefire between the United States and Iran is "generally holding well." According to Odaily, this statement comes despite the lack of progress in marathon negotiations held over the weekend in Pakistan. Trump, speaking to reporters upon his return to Washington from Florida, stated, "I think it's generally holding well. Their military has been destroyed. Their entire navy is at the bottom of the sea." He also mentioned that the U.S. would begin a blockade of the Strait of Hormuz at 10 a.m. Eastern Time on Monday. Additionally, Trump noted that two American soldiers rescued in Iran earlier this month are currently in good condition. #US#Iran#Ceasefire#Tensions#Trump#Military#Negotiations#StraitOfHormuz

Crypto M - Crypto News

@CryptoM · Post #65018 · 10.04.2026 г., 14:06

🚀 Iranian Military Maintains High Alert Amid U.S. and Israeli Tensions On April 10, the Iranian Armed Forces announced that they remain on high alert, ready to engage if necessary. According to BlockBeats, a spokesperson from the Khatam al-Anbiya Central Headquarters stated that this stance is due to repeated breaches of trust by the United States and Israel. The statement underscores ongoing tensions in the region, highlighting Iran's preparedness to respond to perceived threats. #Iran#Military#US#Israel#Tensions#MiddleEast#Alert

Crypto M - Crypto News

@CryptoM · Post #65401 · 13.04.2026 г., 05:15

🚀 U.S. to Impose Blockade on Iranian Ports Amid Tensions U.S. President Donald Trump announced on his social media platform that the United States will enforce a blockade on ships entering and exiting Iranian ports at 10 a.m. Eastern Time on April 13. According to BlockBeats, this decision follows unsuccessful negotiations between the United States and Iran. On April 12, President Trump expressed indifference towards Iran's willingness to return to the negotiating table. He reiterated the plan to impose the blockade and voiced disappointment over NATO's lack of support for the U.S. in the conflict involving Iran. #US#Iran#blockade#Trump#NATO#tensions#MiddleEast#sanctions#diplomacy

Crypto M - Crypto News

@CryptoM · Post #65141 · 11.04.2026 г., 11:36

🚀 Russia and Ukraine Conduct Prisoner Swap Mediated by UAE Russia and Ukraine have successfully exchanged 175 prisoners of war, with the United Arab Emirates playing a mediating role in the process. Bloomberg posted on X, highlighting the significance of this exchange amid ongoing tensions between the two nations. The swap marks a notable development in the efforts to address humanitarian concerns arising from the conflict. Both countries have been engaged in a prolonged conflict, and such exchanges are seen as steps towards easing tensions and addressing the humanitarian impact of the war. The involvement of the UAE underscores the international community's interest in facilitating dialogue and resolution between Russia and Ukraine. This exchange is part of ongoing efforts to manage the humanitarian aspects of the conflict, which has drawn widespread international attention. #Russia#Ukraine#PrisonerSwap#UAE#HumanitarianEfforts#ConflictResolution#InternationalDiplomacy#HumanitarianImpact#Tensions#War