TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #romerías

当前筛选 #romerías清除筛选
Radio Holguín La Nueva

@radioHolguin · Post #10041 · 06.05.2024 г., 15:12

En los coloniales corredores de #Holguín gestamos un diálogo natural, en exclusiva para la Radio Cubana, con una joya del cine 🎞️ cubano: Eslinda Núñez, actriz de filmes icónicos, como "Lucía", "Memorias del subdesarrollo", entre otros... "Ahora veo que se ha desbordado la ciudad, el desfile me emocionó mucho. Se mantienen las #Romerías, que es muy bueno para ustedes", significó. Mientras que Manuel Herrera, Premio Nacional de Cine y compañero de vida de Eslinda, comentó que "a esta maravilla que son las Romerías, es la primera vez que asisto. Hemos visto cómo una ciudad saca sus valores más genuinos a la calle. Apreciarlo es muy importante para nosotros". Ambos fueron invitados a los 65 años del #ICAIC en Romerías de Mayo desde Cámara 📷 Azul. Celebración en la que fue otorgada el Hacha de Holguín al Instituto: recibida por Alexis Triana Hernández, presidente de este, y fundador de las #RomeríasDeMayo.

Radio Holguín La Nueva

@radioHolguin · Post #10049 · 07.05.2024 г., 22:00

Tony Ávila volvió en #RomeríasDeMayo y montó su #Timbiriche😅, junto con todo un repertorio conocido por el público holguinero que lo ovacionó y cantó sus canciones. "Es innegable que las #Romerías son alegría aún en tiempos complejos. No hay dudas que el arte es vida, y eleva el espíritu de los holguineros, cubanos y foráneos. Larga vida a las Romerías de mayo, a sus gestores y artistas", expresó Ávila. Por estos días también llegaron otros artistas a la "ciudad cubana de los parques", como Eduardo Sosa, el dúo Iris, Annie Garcés, Polito Ibáñez (que se presentó en la tarde de este martes en la Casa De Iberoamérica); para, cerrar hoy en la noche, "por todo lo alto", con Alexander Abreu y los chicos de "Habana de primera". 📝 con información de Mavel Ponce de León, la Casa de Iberoamérica y Cesar Hidalgo Torres #SomosCulturaHolguín #CubaEsCultura #Holguín #Cuba

Radio Holguín La Nueva

@radioHolguin · Post #10031 · 05.05.2024 г., 15:51

La esquina del #Jazz abrió sus puertas desde este sábado, para amantes del género, que ya tienen maravillosas descargas, junto con las ofertas gastronómicas de Palmares, informa nuestra periodista Mavel Ponce de León. También puede disfrutar de "Joyas de la #Naturaleza", la expo de fotografías tomadas en varias regiones de #Cuba por el amigo José Alberto Pérez 😍. "Un mensaje de conservación y protección al #MedioAmbiente", dijo a la Radio el joven, quien, durante todo un mes muestra su trabajo en la segunda planta del museo de historia provincial La Periquera. ❤️ Además, una sui generis exposición con los "#Rostros" de una ciudad en el Oriente cubano, logrará observar asimismo en La Periquera. El lente y la sensibilidad en captar las emociones de alegría, tristeza... a personajes íconos de las #Romerías, como el "Chaplin de Cuba", es la muestra que propone Wency Rosales. #RomeríasDeMayo #SomosCulturaHolguín #CubaEsCultura #Holguín #Cuba