@perspectiveix · Post #1465 · 13.08.2018 г., 18:00
🧠 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2KK6r5L 🚀@PerspectiveIX
Hashtags
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #121 · 20 јул.
Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django
Пребарај: #bigthought
@perspectiveix · Post #1465 · 13.08.2018 г., 18:00
🧠 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2KK6r5L 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1457 · 10.08.2018 г., 20:30
🧠 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2KHJq3t 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1453 · 09.08.2018 г., 20:30
🧠 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2KGAECw 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1449 · 08.08.2018 г., 20:30
📰 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2KD25xd 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1445 · 07.08.2018 г., 20:30
📰 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2OfFTLW 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1442 · 06.08.2018 г., 20:30
📰 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2KrRzsB 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1437 · 03.08.2018 г., 10:00
📰 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2LPiR1E 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1435 · 02.08.2018 г., 11:00
📰 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2Azz063 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1434 · 01.08.2018 г., 10:03
📰 Today's #BigThought by Martin Bryant: https://prs.pctvix.co/2OAHJYr 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1492 · 22.08.2018 г., 12:00
📰#iXDailyBrief STAT ⚡️ Research involving 109,780 internet users, aged 16-64 in 42 countries, shows that 46% use social media to stay abreast of current affairs. Out of this group, 29% are people aged 24-35, while 22% are 35-44. (Source: GWI) INSIGHT 🧠 Today #BigThought by Martin Bryant: https://prs.pctvix.co/2MJN5Te OTHER NEWS 📸 Instagram is testing Recommended Posts in the feed: https://prs.pctvix.co/2MLexzW 💸 Netflix is testing a payment feature to bypass Apple’s App Store fees: https://t.me/iXNews/31885 🗣 Snapchat Users Can Activate Face Effects Using Voice Commands: https://prs.pctvix.co/2MPpYa9 🤔 There should be ‘consequences’ for platforms that don’t remove people like Alex Jones, Senator Ron Wyden says: https://t.me/iXNews/31929 ⚖️ Facebook is rating the trustworthiness of its users on a scale from zero to one: https://prs.pctvix.co/2MJnv0N 🎮 Excitement brewing: Snap about to launch a game platform for Snapchat: https://prs.pctvix.co/2MGAmRb — 💌https://prs.pctvix.co/2wj5dt3 Ben, @iXNews 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1488 · 21.08.2018 г., 12:00
📰#iXDailyBrief STAT ⚡️ People Spent 85 Billion Hours In WhatsApp In The Past 3 Months (Versus 31 Billion In Facebook). 85 billion hours is a lot of time. It's 3.5 billion days, or over nine million years -- 9,582,650 years, to be exact. And it's 11.425 hours for every human being on the planet. (Source: Apptopia) INSIGHT 🧠 Today #BigThought by Martin Bryant: https://prs.pctvix.co/2woglF9 OTHER NEWS 🏛 Why Facebook needs a Supreme Court for content moderation: https://t.me/iXNews/31828 📺 Lifestyle publisher Stylist quits IGTV in favor of Apple News: https://t.me/iXNews/31818 🍕 Google created a fake pizza brand to test out creative strategies for YouTube ads: https://t.me/iXNews/31811 🎮 Amazon is ending its 20 percent Prime discount on video game preorders: https://t.me/iXNews/31803 🇻🇪 Venezuela ties its currency to a state-run cryptocoin: https://t.me/iXNews/31799 🚗 Tesla challenger Lucid Motors also in talks with Saudi Arabia for reported $1 billion funding: https://t.me/iXNews/31788 — Have you heard about Pulse? Check it out: https://prs.pctvix.co/2wj5dt3 Ben, @iXNews 🚀@PerspectiveIX
Hashtags
@perspectiveix · Post #1485 · 20.08.2018 г., 10:37
📰#iXDailyBrief STAT ⚡️ New research suggests that six second linear television ads can generate good levels of engagement. In this research, despite six second ads accounting for just 3%, they actually drove 6% of attention. Interestingly, six second ads generated more attention per second than 15 or 30 second ads. They also yielded higher attention per second among all age groups, with adults aged 35 and over paying slightly better attention to six second ads than younger consumers. (Source: Advertising Research Foundation (ARF)) INSIGHT 🧠 Today #BigThought by Martin Bryant: https://prs.pctvix.co/2Mym4Cj OTHER NEWS ⏯ Netflix sets the record straight over plans to introduce ads: https://prs.pctvix.co/2MIgQ6O 🎰 Apple cracks down on gambling apps in China: https://t.me/iXNews/31756 🐦 Jack Dorsey admits Twitter hasn’t ‘figured out’ approach to fake news: https://t.me/iXNews/31739 🗣 A university is outfitting living spaces with thousands of Echo Dots: https://t.me/iXNews/31735 👨👩👦👦 LinkedIn set to launch redesigned Groups platform by end of August: https://prs.pctvix.co/2nTpxgK — "Success is to wake up each morning and consciously decide that today will be the best day of your life." ― Ken Poirot Happy Monday! Ben, @iXNews 🚀@PerspectiveIX
Hashtags