Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
iQiyi представляет впечатляющую смесь для следующего года программирования
✅ Китайская стриминговая платформа iQiyi, аналог Netflix, анонсировала выход более 400 новых проектов на оставшуюся часть года и на 2026 год. Она стремится развивать свой популярный контент как в длинном, так и в коротком формате, при этом материалы с использованием искусственного интеллекта приобретают все большую популярность.
📌 Компания заявила, что по мере своего развития она продолжит инвестировать в свои основные длинные драмы, а также ускорит рост вертикальных микродрам, которые стали ключевым фактором роста аудитории.
💬 «Сочетание длинного и короткого контента в сочетании с преобразующим влиянием ИИ коренным образом меняет мир развлечений», — заявил Гун Юй, основатель и генеральный директор iQiyi, на конференции компании iJOY 2025 в Шанхае.
💬«Наша неизменная миссия — доставлять пользователям эмоциональную ценность в каждой точке контакта — как онлайн, так и офлайн».
✅ Гун также представил планы по открытию нового iQiyi Land и подчеркнул растущую роль ИИ, заявив, что «момент, когда ИИ произведет революцию как в длинном, так и в коротком контенте, неизбежен».
Источник: chinadaily
@chinastocksnet
Если полезно, поставьте лайк 👍😇
#IQ
IQ тест это опросник, разделенный на блоки. В каждом много вопросов, логических, образных, есть графические задачи, ряды значений, где нужно выявить систему. Отвечают "на время", думать долго нельзя.
По результатам система рассчитывает балл, уровень примерно в 100 является "нормальным", но чем больше тем лучше. Есть общедоступные онлайн-системы, где тест проходят люди из разных стран, и такие системы публикуют "страновые рейтинги интеллекта". По рейтингу мы на 6 месте в мире, после Китая, Японии, Кореи, Сингапура и внезапно Ирана. США и вся Европа далеко под нами. Хуже всего в рейтинге Африка.
Как мы относимся к IQ-тестам? Это работает или это глупая выдумка и они ничего не показывают?
Я проходил, работают - 👍
Я проходил, они не работают - 👎
Не проходил и не верю - 🤝
#iq
🚀#BTC at $220k by the New Year?
The holder of the highest #IQ flew into Bitok on highs, and stated that in the next 45 days, #Bitcoin will grow to $220000...
👻 Quiz-Клуб продолжает причинять добро и наносить пользу — помогаем думать с удовольствием и азартом, чтобы так незаметно укреплять нейронные связи и тем самым оттягиваем свой Альцгеймер 😁
Уже совсем скоро — в среду 26 февраля с 19.30 в Chester pub (Чуй, 207) играем Классику Quiz-Клуба 🤔
Ту самую игру, с которой всё начиналось; ту игру, где могут пригодиться любые знания; ту игру, где большая команда точно имеет смысл (а небольшая всегда имеет шанс ☝🏻).
✅ 60 вопросов на знания и логику;
✅ Вопросы-аукционы и уникальный Золотой вопрос;
✅ Продолжительность игры около 2,5 часов;
✅ Взнос — 500 сом с человека;
✅ В командах 2-10 человек;
✅ Регистрация сообщением с названием команды или с помощью
ФОРМЫ РЕГИСТРАЦИИ
Присоединяйтесь, вместе думать веселее 😉
#игры#iq
@BishDvizh
👻 Ну что, игроманы, джойстиколюбы и геймофилы, пришла ваша пора 🕹
Вспоминаем игры, игрища, игрульки — от змейки и Дюны до Скайрима и RDR2, от танчиков на Денди до Мира танков, от Принца Персии до Индики.
Конечно, как всегда в Квизофрении, тема — это больше антураж и повод пошутить, так что если вы не помните ни одной фаталити — ничего страшного 💀
Чтобы попасть на игру, нет нужды лезть в трубу, карабкаться по лианке или разбивать головой кирпичи 🍄 Достаточно зарегистрироваться с помощью ФОРМЫ РЕГИСТРАЦИИ
Катка состоится в среду 19 февраля в 19:30 в Chester pub (Чуй, 207)
Го, я создал ✋🏻
#игры#iq
@BishDvizh
✈️ Лучший способ изучать мир — это Путешествия! И мы приглашаем вас в квиз-путешествие по разным странам. Будем изучать их флору и фауну, людей, привычки и обычаи, ландшафты и истории. Ведь игры Quiz-Клуба — это всегда не только соперничество в том, кто больше знает, но и обогащение новыми знаниями ☝🏻
Вас ждёт:
✅ 60 вопросов на знания и логику;
✅ Вопросы-аукционы и уникальный Золотой вопрос;
✅ Продолжительность игры около 2,5 часов;
✅ Взнос — 500 сом с человека;
✅ В командах 2-10 человек;
✅ Регистрация сообщением с названием команды или с помощью
ФОРМЫ РЕГИСТРАЦИИ
12 февраля с 19.30
в баре Chester pub (Чуй, 207)
Присоединяйтесь, вместе веселее 👻
#игры#iq
@BishDvizh
5 февраля вечером в Chester pub (Чуй, 207) сыпнём песка, опракинем совком, тряхнём стариной и сыграем квиз по Кинематографу эпохи СССР! А это не только Гайдай и Михалков — это огромный мир от Эйзенштейна и Дзиги Вертова до Бортко и Абуладзе☝🏻 И поверьте, весь советский кинематограф никто не знает досконально! 😉
👗Тематический дресс-код приветствуется! Решите, из какого фильма будет ваша команда? Будет ли у вас Людмила Прокофьевна и товарищ Новосельцев или Ипполит, Женя Лукашин и их Наденька? Пацаки и чатлане с планеты Плюк или Алиса (с миелофоном), космические пираты и робот Вертер? А может быть Интердевочка? 😘
✅ 60 вопросов на знания, логику и ностальгию;
✅ Вопросы-аукционы и уникальный Золотой вопрос;
✅ Продолжительность игры около 2,5 часов;
✅ Взнос — 500 сом с человека;
✅ В командах 2-10 человек;
✅ Регистрация сообщением с названием команды или с помощью
ФОРМЫ РЕГИСТРАЦИИ
_
#игры#iq
@BishDvizh