TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 223 слични објави

Пребарај: #rock

当前筛选 #rock清除筛选
贼歪说

@AboutZY · Post #2128 · 16.05.2023 г., 02:06

#每日一歌#Rock 🎰Oasis - 《The Masterplan》 Oasis 我最爱的一首。 很多事情啊,真的不能尽信事在人为,而是冥冥之中自有天意。正所谓是「一个人的命运啊,当然要靠自我奋斗,但是也要考虑到历史的进程」。 频道:@AboutZY

贼歪说

@AboutZY · Post #1840 · 17.01.2023 г., 03:22

#每日一歌#Rock 🎫Billy Joel - 《Piano Man》 一首少见的糅合了口琴和钢琴的歌。 这首歌改编自作者的真实经历,Billy Joel 由于和签约的唱片公司发生冲突,和妻子一起离开了纽约去往洛杉矶生活,这段时间里他在一个名叫 The Executive Room 的酒吧,以 Bill Martin 的身份担任了六个月的钢琴手。歌词里那些想成为明星的调酒师,想写小说的房地产人都是真实的酒吧顾客,而「waitress」就是他的妻子,当时他弹钢琴,妻子则是服务员。 频道:@AboutZY

贼歪说

@AboutZY · Post #1650 · 11.11.2022 г., 01:10

#每日一歌#Rock ☔Guns N' Roses - 《November Rain》 在我印象中,北方秋冬的接力棒总是一场雨,之后下班路上就清凉过了头,5 号楼和 7 号楼之间会刮起 120 斤级的狂风。北京今天大雾,又淅淅拉拉丢了几滴毛毛雨,大概是听这首「November Rain」的最佳时机了。 十一月雨是我最爱的摇滚乐之一,主唱硬得发慌的嗓音唱出了枪花独树一帜的柔情,而 6 分 47 秒每每以为歌曲要结束时,旋律又峰回路转,高音吉他与前半段风格迥然。整首歌长达 9 分钟,但丝毫不会觉得冗长。 我强烈💪建议你观看 MV,9 分钟的 MV 混剪了现场演出和一个还算完整的故事。6 分 47 秒同样也是 MV 的转折点,吉他手站上钢琴,主人公开始梦魇。实际上 November Rain 改编自 Del James 的短篇小说《Without You》,如果你对背景故事感兴趣,不妨看看这篇 知乎 解读。 就在几天前(2022.11.05),枪花放出了 November Rain (2022 Version) 和 重制版 MV,新版除了音质更好,还用真实的乐器采样替代了之前的合成音。不过我个人是听不太出来什么区别啦,都点红心♥️就完事了! 频道:@AboutZY

贼歪说

@AboutZY · Post #1368 · 04.08.2022 г., 01:51

#每日一歌#Rock 🪨Duffy - 《Distant Dreamer》 JOJO6 石之海的片尾曲。我们真的可以永远相信荒木老师。 频道:@AboutZY

123•••10•••1819
ПретходнаСтраница 1 од 19Следна