TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #benefits

当前筛选 #benefits清除筛选

🇺🇿 Rossiya Federatsiyasi Moliya vazirligining ilmiy-tadqiqot moliya instituti, katta ilmiy xodimi - Aleksey Popovning, Moliyaviy hisobotning asosi sifatida Xalqaro moliyaviy hisobot standartlaridan universal foydalanishga o‘tishda korxonalar uchun qanday o‘ziga xos imtiyozlar va qiyinchiliklar yuzaga kelishi mumkinligi borasida. ___ 🇷🇺 Cтарший научный сотрудник Научно-исследовательского финансового института Министерства Финансов Российской Федерации - Алексей Попов, о том, какие конкретные преимущества и трудности могут возникнуть у предприятий при переходе на универсальное использование МСФО в качестве основы финансовой отчетности. #GraduateSchool#Finance#Benefits#Standards Web-site | Telegram | Facebook | Instagram

StartupBase

@startupbaseuz · Post #4702 · 26.10.2024 г., 07:36

Uzbekistan is the right place now to look for growing your business - this message was given by many distinguished panelists at International partnership initiatives week. Only this year the number of companies with foreign capital, who decided to utilize these opportunities to grow their business increased by 250! You can also get the best tax regime upuntil 2040 for ITES companies, affordable talents and low cost of starting your business with the Zero Risk programme in the regions of Uzbekistan: https://outsource.gov.uz Guest Insights: 📌Boris Tadić - former president of Serbia: "Uzbekistan is one of the most #favorable countries for business operations and investments for European companies and IT firms." 📌Raimonds Vejonis - former president of Latvia: "The extension of #benefits for IT Park residents until 2040 will increase investor #confidence." 📌Hamadoun Toure - former head of ITU: “Uzbekistan has taken the leading position in the International Telecommunication Union’s ranking for the most #affordable internet prices.” 📌Akihiro Sakurai: "Uzbekistan has the #potential to supply 300,000 young specialists to the international IT market, generating high incomes." 📌Seán McEllin: “Uzbekistan is becoming the #ideal_location for major IT companies to open their regional offices.” With its forward-looking #digitalstrategy and #commitment to innovation, Uzbekistan is emerging as a dynamic regional hub for international businesses and tech #startups alike. Exciting times ahead for #partnerships and #growth! Uzbekistan is shaping up to be a vibrant regional hub, creating countless opportunities for innovation and foreign partnerships. Follow in Linkedin: https://www.linkedin.com/in/sherzod-shermatov/ #Uzbekistan#ITES#DigitalTransformation#GlobalBusiness#Investment