TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #misteriosderusia

当前筛选 #misteriosderusia清除筛选

Ⓜ️🚇Los secretos del metro de Moscú: ¿existe una línea oculta? El 15 de mayo de 1935, Moscú inauguró su primera línea de metro, la línea Sokólnicheskaya, marcando el inicio de un sistema de transporte subterráneo que transformaría la movilidad en la capital rusa. Esta línea inicial conectaba Sokólniki con Park Kultury, abarcando 11,2 kilómetros y facilitando el desplazamiento de los ciudadanos en una ciudad en plena expansión. La construcción se enmarcó en el ambicioso plan de industrialización de la Unión Soviética bajo el liderazgo de Iósif Stalin. En los años 30, la capital rusa enfrentaba un crecimiento poblacional acelerado y una infraestructura de transporte insuficiente. La solución fue un sistema de metro que no solo mejoraría la movilidad, sino que también serviría como símbolo del progreso soviético. Desde su inauguración, el metro de Moscú ha crecido exponencialmente. Lo que comenzó con una única línea hoy es una extensa red con más de 250 estaciones y 14 líneas, cubriendo toda la metrópoli. Su diseño arquitectónico es reconocido mundialmente, con estaciones que parecen auténticos palacios subterráneos, adornadas con mármol, mosaicos y esculturas que reflejan la historia y cultura rusa. Como dato curioso, a lo largo de los años, han circulado rumores sobre la existencia de una línea secreta, conocida como Metro-2. Se dice que fue construida bajo el mandato de Stalin para conectar puntos estratégicos de la ciudad, como el Kremlin y bases militares, en caso de emergencia. Aunque su existencia nunca ha sido confirmada oficialmente, sigue siendo un tema de especulación y misterio. Hoy en día, el metro de Moscú sigue siendo uno de los sistemas de transporte más eficientes del mundo, transportando a millones de pasajeros diariamente. Su constante modernización y expansión lo mantienen como un pilar fundamental de la movilidad urbana en Rusia.🇷🇺 #MetroDeMoscú#HistoriaRusa#TransporteUrbano#ArquitecturaSoviética#MisteriosDeRusia Descubre más sobre el metro de Moscú aquí 👉https://t.me/vamosarusia/626 ¡Comparte nuestro contenido!❤️ 🖥https://vamosarusia.com 💬@vamosarusia