Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Экспозиция выставки, как и её название, двойственна. Первый раздел проекта раскрывает понятие листа книжного. В этом зале вы сможете познакомиться с иллюстрациями Чернышевой к «Денискиным рассказам» Виктора Драгунского (V-A-C Press, 2023), а также с неопубликованными акварелями из проекта «Метро для детей» (Secession, 2017). Отдельный стенд первого зала посвящен книге «О рисунках», где представлены работы художницы, созданные специально для выставки, и произведения из более ранних серий. Их дополняют комментарии автора.
Два других зала выставки, посвященные образу листа как растительного элемента, предполагают особый, «неантропоцентричный», ракурс, где люди уступают место природе. В залах представлены разные состояния природы в акварелях и живописных работах, видео-инсталляции «Blue ovals», а также в графических работах разных лет и фотографиях.
Прекрасно архитектурное решение выставки, разработанное Сашей Ким — это одновременно и мастерская художника, и поэтический природный ландшафт. Когда выставочное пространство служит не просто фоном для экспозиции, а поддерживает её, вливается в её идею, становясь с экспонатами единым целым, у посетителя появляется возможность глубже погрузиться в художественное принятие автора.
Выставка продлится до 17 мая 2026 года.
Адрес: Маросейка ул, 11/4 с1
Время работы: ежедневно с 12:00 до 21:00.
Цена билета: взрослый - 400₽, есть льготы.
Возрастной ценз 6+.
#AZ
К своему десятилетию Музей AZ создал себе и нам великолепный подарок. В пространстве музея разместилось открытое хранение фондов музея с произведения Анатолия Зверева.
Здесь, прямо в выставочных залах вы словно перемещаетесь в святая святых - музейное хранение, получая возможность узнать, как хранятся шедевры и поработать с ними, как сотрудник музея.
На первом этаже разместились произведения из коллекции Костаки. В 2013 году идея создания музея была поддержана дочерью Георгия Костаки – Алики. Она подарила 600 работ и архивных материалов Анатолия Зверева.
Второй этаж стал хрестоматией по автопортретам художника. В экспозицию вошло более 260 произведений Анатолия Зверева, включая 67 автопортретов художника и 88 работ из собрания легендарного коллекционера Георгия Костаки.
Третий этаж – это само открытое хранение. Музей предлагает погрузиться в мир художника и начать более серьезное общение с его творчеством.
«По рисункам моим и картинам можно видеть и слышать меня»
Анатолий Зверев.
Хочется отметить, что в музее появился небольшой кинотеатр и место для проведения мастер-классов. Вообще, к этой экспозиции подготовлена обширная программа мероприятий и их расписание скоро появиться на сайте музея. Так что не пропустите заинтересовавшие вас события.
Также, на третьем этаже есть мониторы с огромным количеством произведений Зверева, которые можно порассматривать в хорошем качестве и более полно познакомиться с его творчеством. Мы же рекомендуем посетить эту экспозицию с экскурсией.
Выставка продлится до 04 октября 2026 года.
Адрес: ул. 2-я Тверская-Ямская, 20-22. Ст. метро «Маяковская».
Время работы: ежедневно 12:00 – 21:00
Каждый первый понедельник месяца музей закрыт (технический день).
Цена билета: взрослый - 400₽, есть льготы.
#AZ
Прошли сегодня самый популярный маршрут гранд каньона. Заняло около 4 часов с остановками на фото и осмотром.
В парке крутая инфраструктура – каждые 5-10 мин курсируют автобусы и останавливаются на обзорных точках. По всему трейлу есть туалеты и фонтаны с водой, кафе.
Белых американцев не видать, видимо, все отдыхают после праздника. В парке одни калифорнийские номера и индусы/азиаты (видимо, иммигранты, которые не празднуют день благодарения).
Самый интересный, по мне, маршрут - Bright angel trail - 13 км по протяженности в одну сторону и перепад высоты 1300м. На этом маршруте ты спускаешься в каньон к реке Колорадо, ночуешь в самом каньоне и на следующий день поднимаешься обратно. Либо можно то же самое сделать на мулах.
#AZ
Проехали сегодня 530 км, добрались до отеля в парке каньона. Заканчиваем день фоткой на закате.
Удивлением стало, что в самом парке располагается небольшой туристический город с отелями и ресторанами, а вокруг каньона целый лес.
В голове представлялось по-другому – пустыня и сам каньон, никакого леса с городом и изредка снегом быть не должно.
#AZ
⚽️🇪🇺Europa League
Athletic 2-0 AZ#EuropaLeague#Athletic#AZ
San Mamés adelantó el festejo y celebró el triunfo desde minutos antes que el húngaro Berke pitara el final. El trabajo estaba hecho. El Athletic se impuso en un partido más que trabajado y que no se decidió hasta el tramo final. Dos picotazos de Nico, en uno asistiendo y en otro participando activamente en la jugada, terminaron en los dos goles rojiblancos.
https://www.marca.com/futbol/europa-league/cronica/2024/10/03/66ff055f46163f323c8b4581.html
🏆@Info288_deportes
Я много ездил по тюркским странам, следил за традициями и собирал наблюдения. Один из самых интересных обычаев, который имеет место в тюркских странах — обычай пить чай, и пьют его везде по-разному.
По итогам этих наблюдений я написал статью про Тюркскую чайную церемонию, где собрал чайные традиции и обычаи разных стран, от Турции до Казахстана. Так что приглашаю к чаю и прошу читать!
И, разумеется, если увидите какие-то нюансы и ошибки, не стесняйтесь меня исправлять и дополнять.
#tr#az#uz#kz#tm#kg