@stockswarn · Post #1090167 · 30.03.2022 г., 06:02
#栖霞建设#ss600533 9.686%#逼近涨停 #自贸区2.269% #江苏自贸区3.037% #REITs3.485% #独角兽1.295% #房地产5.513% #雄安新区2.271% #金融科技1.882% #破净股1.473%
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #121 · 20 јул.
Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django
Пребарај: #reits
@stockswarn · Post #1090167 · 30.03.2022 г., 06:02
#栖霞建设#ss600533 9.686%#逼近涨停 #自贸区2.269% #江苏自贸区3.037% #REITs3.485% #独角兽1.295% #房地产5.513% #雄安新区2.271% #金融科技1.882% #破净股1.473%
@stockswarn · Post #1090164 · 30.03.2022 г., 06:02
#栖霞建设#ss600533 9.162%#逼近涨停 #房地产5.513% #雄安新区2.271% #金融科技1.882% #破净股1.473% #自贸区2.269% #江苏自贸区3.037% #REITs3.485% #独角兽1.295%
@stockswarn · Post #1089836 · 30.03.2022 г., 05:23
#栖霞建设#ss600533 9.162%#逼近涨停 #自贸区1.952% #江苏自贸区2.925% #REITs3.651% #独角兽1.107% #房地产5.730% #雄安新区1.987% #金融科技1.669% #破净股1.406%
@stockswarn · Post #1089781 · 30.03.2022 г., 05:16
#栖霞建设#ss600533 9.162%#逼近涨停 #江苏自贸区2.976% #REITs3.344% #独角兽1.054% #房地产5.511% #雄安新区1.957% #金融科技1.671% #破净股1.312% #自贸区1.930%
@stockswarn · Post #1089765 · 30.03.2022 г., 05:15
#栖霞建设#ss600533 9.162%#逼近涨停 #破净股1.312% #自贸区1.930% #江苏自贸区2.984% #REITs3.157% #独角兽1.054% #房地产5.511% #雄安新区1.933% #金融科技1.671%
@stockswarn · Post #1089759 · 30.03.2022 г., 05:14
#栖霞建设#ss600533 9.162%#逼近涨停 #江苏自贸区2.976% #REITs3.344% #独角兽1.054% #房地产5.511% #雄安新区1.957% #金融科技1.671% #破净股1.312% #自贸区1.930%
@stockswarn · Post #1089737 · 30.03.2022 г., 05:11
#栖霞建设#ss600533 9.162%#逼近涨停 #REITs3.221% #独角兽1.121% #房地产5.387% #雄安新区1.968% #金融科技1.790% #破净股1.301% #自贸区1.893% #江苏自贸区2.899%
@stockswarn · Post #1089732 · 30.03.2022 г., 05:11
#栖霞建设#ss600533 9.162%#逼近涨停 #独角兽1.150% #房地产5.409% #雄安新区1.987% #金融科技1.789% #破净股1.328% #自贸区1.918% #江苏自贸区2.930% #REITs3.179%
@stockswarn · Post #1089701 · 30.03.2022 г., 05:08
#栖霞建设#ss600533 9.424%#逼近涨停 #江苏自贸区2.673% #REITs3.116% #独角兽1.022% #房地产5.316% #雄安新区1.956% #金融科技1.799% #破净股1.249% #自贸区1.834%
@stockswarn · Post #1089695 · 30.03.2022 г., 05:07
#栖霞建设#ss600533 9.424%#逼近涨停 #雄安新区1.956% #金融科技1.799% #破净股1.249% #自贸区1.834% #江苏自贸区2.673% #REITs3.116% #独角兽1.022% #房地产5.316%
@stockswarn · Post #1089636 · 30.03.2022 г., 05:00
#栖霞建设#ss600533 9.686%#逼近涨停 #江苏自贸区2.340% #REITs2.544% #独角兽0.738% #房地产4.530% #雄安新区1.749% #金融科技1.299% #破净股0.965% #自贸区1.581%
@stockswarn · Post #1090179 · 30.03.2022 г., 06:03
#栖霞建设#ss600533 9.948%#封涨停板 #江苏自贸区3.031% #REITs3.464% #独角兽1.325% #房地产5.499% #雄安新区2.299% #金融科技1.922% #破净股1.496% #自贸区2.291%