Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Не хочу выбирать
Недавно включил Netflix и под контентным блоком сериала увидел подпись:«👍👍Думаем, вы будете в восторге!». Маленькое дизайн дополнение, которое может привнести вполне значимые изменения в поведение пользователей.
Обоюдоострый меч выбора. Нам мало, но до кого-то момента. А потом полный шкаф одежды, но «нечего надеть». Выбор — это риск, выбор это затраты умственной энергии. Мы не хотим тратиться и мы не хотим проиграть.
Сегодня, там где есть выбор — есть алгоритмы и системы помогающие снизить его негативное влияние на пользователя. Не все бренды печенья и молока, а идеальный подбор продуктов для вашего завтрака. Не бесконечная лента футболок, а «то, что дополнит образ» и «вам может понравится». Не вся мировая музыка, а музыка под ваше настроение (Spotify AI DJ, Яндекс ‘Моя Волна’).
Недавно TaoBao (принадлежит Alibaba) выпустили два AI инструмента для категории одежды и аксессуаров - “AI-assisted outfit pairing” и“AI fitting room”.
Первый помогает в подборе комбинаций гардероба. Второй — примерить образ по своей фигуре, создав в свой диджитал аватар. Похожие функции появились на платформе Farfetch, нативно подбирающие полный ‘мэтч’ по стилю.
Netflix был одним из пионеров в алгоритмах предложения контента под вас. Возможно, сейчас команда ищет решения как еще больше снизить муку выбора пользователя. Хорошо, когда фильм выиграл 🏆 Оскар, или в числе актеров Ди Каприо. Но что делать, когда у вас в базе тысячи интереснейших, но не раскрученных позиций. Тогда «👍👍Думаем, вы будете в восторге!».
p.s. Судя по заголовку моей рекомендации в Netflix «Ешь богатых!», я анти-капиталист и анархист.
#UX#consumers
@planning_horizon
Up or down? China faces inflation conundrum
Chinese factory prices are rising at a record rate, but weak demand has seen consumer price inflation fall, and that leaves policymakers with a dilemma
#News#Reuters#China#Inflation#Consumers
Subscribe: http://smarturl.it/reuterssubscribe
Reuters brings you the latest business, finance and breaking news video from around the globe. Our reputation for accuracy and impartiality is unparalleled.
Get the latest news on: http://reuters.com/
Follow Reuters on Facebook: https://www.facebook.com/Reuters
Follow Reuters on Twitter: https://twitter.com/Reuters
Follow Reuters on Instagram: https://www.instagram.com/reuters/?hl=en
➖@reutersworldchannel➖
IKEA reports record full-year retail sales
IKEA reports record full-year retail sales of $48.7 billion despite global supply chain disruptions as housebound consumers spent more on their homes
#News#Reuters#Ikea#RetailSales#Consumers
Subscribe: http://smarturl.it/reuterssubscribe
Reuters brings you the latest business, finance and breaking news video from around the globe. Our reputation for accuracy and impartiality is unparalleled.
Get the latest news on: http://reuters.com/
Follow Reuters on Facebook: https://www.facebook.com/Reuters
Follow Reuters on Twitter: https://twitter.com/Reuters
Follow Reuters on Instagram: https://www.instagram.com/reuters/?hl=en
➖@reutersworldchannel➖
💶 Germany’s Mood: Recession Vibes, Election Hangover
German consumers are looking at 2026, seeing a technical “recovery,” and still slamming their wallets shut. The GfK/NIM consumer climate index for March slipped again to -24.7, defying forecasts it would improve to around -23.1 and staying deep in “people are cutting back” territory.
The guts of the survey are worse than the headline. Willingness to buy dropped sharply to -9.3 in February from -4.0 in January, while willingness to save ticked up, meaning households prefer cash cushions over big purchases. Economic expectations for the next 12 months fell by more than 2 points to 4.3, still slightly better than a year ago but heading the wrong way again.
Officially, the story is “slight recovery, skeptical consumers.” In practice, you have Europe’s biggest economy stuck in low gear: high operating costs, weak domestic demand, geopolitical shocks, and a government that keeps signaling fiscal tightening while talking about “structural reforms.” Growth in 2026 is expected to be driven mostly by calendar and statistical effects, not real momentum anyone in a kebab line on Kurfürstendamm can feel.
Berlin sells optimism in press conferences. German households are voting with their savings accounts.
#Germany#economy#inflation#consumers#EU#recession
📱American Оbserver - Stay up to date on all important events
🇺🇸
UrbanChain Secures $63.17M
UrbanChain raises $63.17M on December 16, 2024. The platform invites consumers, prosumers, and generators to create their marketplace.
For more details, visit: UrbanChain
#UrbanChain#Funding#Marketplace#Investment #2024 #Consumers#Prosumers#Generators#Economy#Blockchain#Crypto#Technology#Innovation#Decentralization#Startups#Business#Revenue#Growth