TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #rusosenchile

当前筛选 #rusosenchile清除筛选
Casa de Rusia en Chile 🇷🇺🇨🇱

@casaderusiaenchile · Post #789 · 26.01.2025 г., 16:10

Un día como hoy, hace 80 años, el Ejército Soviético liberó los prisioneros del campo de concentración y exterminio Auschwitz-Birkenau Auschwitz-Birkenau fue el mayor campo de concentración y exterminio nazi durante la Segunda Guerra Mundial. Establecido en 1940 cerca de la ciudad polaca de Oświęcim (en alemán, Auschwitz), se convirtió en un símbolo del Holocausto. Auschwitz II-Birkenau fue el lugar donde más de 1,1 millones de personas, en su mayoría judíos, fueron asesinadas. También murieron prisioneros de guerra soviéticos, polacos, gitanos y otras minorías perseguidas por el régimen nazi. El 27 de enero de 1945, el campo fue liberado por el Ejército Soviético. Desde entonces, Auschwitz-Birkenau se ha convertido en un importante lugar de memoria y educación sobre los horrores del Holocausto y las atrocidades de la Segunda Guerra Mundial. #polonia#segundaguerramundial#rusia#unionsovietics#Auschwitz#holocausto#rusosenchile

Casa de Rusia en Chile 🇷🇺🇨🇱

@casaderusiaenchile · Post #763 · 03.01.2025 г., 16:46

¡Únete a una aventura espacial sin precedentes! 🚀🎥 La Casa de Cultura de Rusia y La Corporación Cultural Las Condes te invitan a disfrutar de la primera película de ficción rodada en la Estación Espacial Internacional: "El Desafío". Sigue la emocionante historia del cosmonauta Oleg Ivanov, que necesita una cirugía cardíaca en gravedad cero. No te pierdas esta oportunidad única de ver cómo la ciencia y el cine se unen en una aventura espacial inolvidable. 📅 Fecha: 11 de enero 🕐 Hora: 21.30 📍 Lugar: Parque Araucano Más información: @culturallascondes ¡Reserva tu lugar y prepárate para despegar hacia una aventura espacial sin límites! #rusia#rusosenchile#cineruso#lascondes#festivaldecinelascondes#parquearaucano#corporacionculturallascondes

Casa de Rusia en Chile 🇷🇺🇨🇱

@casaderusiaenchile · Post #782 · 21.01.2025 г., 15:16

El brillo de las luces y el tintineo de las copas de champán. En Santiago se celebró un baile siguiendo las mejores tradiciones de la corte imperial. En el salón de la sociedad «Círculo Ruso» se reunieron más de 60 invitados: damas y caballeros con elegantes trajes . La velada comenzó con un majestuoso polonesa que, al igual que en las asambleas de la época de Pedro el Grande, marcó el tono de toda la noche. Las parejas llenaron luego la pista al ritmo del pas d’Espagne, la cuadrilla moscovita, el galope y el vals vienés. «Este tipo de encuentros no solo son una celebración, sino también una oportunidad para fortalecer nuestra diáspora y acercar la cultura e historia rusa a los chilenos», destacó Nina Milovidova, directora de la Casa Rusa en Chile. El baile, organizado por KSORS y la Casa Rusa en Santiago, ya es una tradición consolidada que, en su tercera edición, reunió tanto a la comunidad local como a la de habla rusa. #gala#ñuñoa#santiago#rusos#rusosenchile#cursorusochile#бал#чили#россия