Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Audio Notes
Take audio notes(recordings)
AudioNotes is a simple app allowing you to take voice recordings – a dictaphone. It supports light and dark theme, lets you save and edit your recordings.
Download - https://github.com/certified84/AudioNote/releases
https://github.com/certified84/AudioNote
#New#Multimedia#notes
@foss_Android
¿Que puede hacer este bot?
@MediaEditorRoBot
Este bot ayuda a los administradores de canales a editar publicaciones multimedia
Simplemente envíe un mensaje de medios al bot y reenvíe una publicación de canal al bot, luego el bot reemplazará la publicación con los medios enviados por el usuario
Idioma: inglés
(Visto en @botsgram_cu)
#canales#herramientas#multimedia#publicaciones
🚨выставка-байопик «Виктор Цой. Легенда»отPlanet9
Наша инсталляция часть от экспозиции, которая занимает 3000 кв. метров
Для ее реализации было использовано:
• 40 zoom bar DS-192 12x40w
• 160 Led-палок 270, которые используются как led-экран
* звуковое сопровождение к выставке записано в аудиогиде, поэтому для погружения мы наложили музыку к видео 🎧
📍Санкт-Петербург, Севкабель Порт
12.10 – 18.03
#dreamlaser#installation#multimedia
Робот-МАГ, digital art, Doping Pong, 2009
Персонаж, придуманный арт-группой Doping Pong для фирменного стиля Международного мультимедиа фестиваля MIGZ.
Россия, Москва, кинотеатр 35MM, июнь 2009 года.
Первые карандашные эскизы этого персонажа появились в 2001 году и ждали своего часа.
#dopingpong#robot#mag#migz#multimedia
🤖Nuevo bot
📋 Nombre: Downloadlyio
🆔 Nombre de usuario: @downloadlyio_bot
⭐️ Calificación: ⭐️⭐️⭐️⭐️ (5/5 de 410 votos)
————————————————————
ℹ️Descripción: ¡Descarga medios súper rápidos de Instagram, YouTube, Facebook, Snapchat, Twitter, Tiktok y más!
PD: Para descargar todas las historias activas o momentos destacados de Instagram de una sola vez, simplemente envíe el enlace del perfil.
🚀 ¡Simplemente pega la URL y observa cómo se desarrolla la magia! ✨
🌐 Idiomas: inglés
💬 Soporta en línea: No
👥 Grupos: si
#️⃣ Etiquetas: #descargar#Multimedia#RedesSociales#Tiktok#Youtube#Instagram#Snapchat.
🤖Descargar descarga
nombre de usuario: @downloadlyio_bot
🎭: #descarga, #multimedia
👄: inglés
⭐: 4.7
💬 ¡Descargue contenido multimedia de los medios de comunicación súper rápido.
#instagram, #youtube, #Facebook, #snapchat, #Twitter, #TiktOk!
🚗✨The Updated Volvo XC90 Unveiled Ahead of Premiere!🌟
The iconic SUV has undergone a complete makeover, featuring a brand-new front design and an upgraded multimedia system! 🎉🔧
Stay tuned for details on the powertrains, set to be revealed on September 4th during the full premiere! 🗓️👀
#VolvoXC90#CarReveal#SUV#Innovation#Design#Multimedia#Premiere#Auto#VolvoLove
¿Que puede hacer este bot?
🤖@AddChanBot🔁
Este bot reenvía mensajes de otros canales (públicos y privados) a tus chats de preferencia. Además, si quieres desbloquear más chats y fuentes, haz clic en la opción "💎 Premium" del bot.
#Chats#Channels#Fuentes#Reenvío#Utilidad#Gratis#Premium#Automático#Público#Privado#Multimedia#Formato
(Visto en: @BotsGram_Cu)