TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #brendel

当前筛选 #brendel清除筛选
Classical Music

@exploreclassical · Post #119 · 09.12.2020 г., 01:25

下午稍微读了一下Alfred Brendel的essay “Must Classical Music Be Entirely Serious”的第二部分,专门讲的今早分享的Diabelli Variations。这篇essay的主题就是音乐的“不正经”,幽默、讽刺等等,所以这篇文章也是主要从Diabelli Variaion的幽默性出发~essay信息量太大了,我也没完全读明白,这里就写几条我印象比较深的抛砖引玉一下吧~感兴趣的朋友非常推荐这篇essay,我们可以在群里一起讨论! 1. 和贝多芬其他的变奏曲相比Diabelli Variations是非常不正统的。比如一般情况下第一首变奏曲都会和主题十分相近(这里可以参考Mozart的小星星变奏曲),但是这里贝多芬非常意外的放了一首和主题不仅不相近,可以说是反义词的变奏,一首4/4的march跟在3/4的waltz后面,出人意料。有趣的是,有研究发现这第一个variation是最后才加上去的。 2. 大多数变奏曲可能有一个变奏的“标准”,比如哥德堡是基于bass的变奏,小星星是基于旋律的变奏,贝多芬的大多数变奏曲也有这样的一个“变奏标准”,但是这首Diabelli Varitions并没有一个统一的标准,很自由。 3. 这首变奏曲的不正统还体现在对主题结构上的改变,经常删掉几个小节或者加几个小节,变奏22更是直接“换了旋律”,用了Don Giovanni里的Notte e giorno faticar来模仿主题,作者认为这是在make fun of the theme~ 4. 主题在这套变奏曲里起的角色可能就是引出了幽默,变奏曲们都“超越”了主题的控制,后面的变奏曲中更像是我们要在变奏中去找主题,而不是主题中创造出变奏的感觉。 5. 除了让人发笑的主题以外,变奏曲里也有很多非常sublime的主题,比如variation 14,20, 24,但紧跟着这些sublime之后的都是幽默的变奏,对比强烈。作者这里引用了Jean Paul的一个说法,他认为幽默是“the sublime in reverse”~另外还有一个对比是从var 29-31和var 32. Var 29-31是C minor的集中区域,最后以var 32的一首欢快的fugue结束。 6. Essay里还总结了变奏中的motivic elements,比如upbeat embellishment,重复的和弦,dance rhythm等等,这里贴一张截图。 7. Brendel还给每首变奏取了名字~看着名字听了一下感觉都蛮合适的!其中有很多蛮有趣的,比如var 1他起的名字是gladiator,flexing his muscles,var 15是cheerful spook等待~这里也贴张截图~ 8. 另外关于为什么是33首变奏也蛮有趣。Diabelli来催贝多芬交作业的时候,贝多芬问他手里已经有多少首变奏了,Diabelli说有32首,然后贝多芬说那你去发表吧,我一个人要写33首。另外33也和贝多芬的Piano Sonata有联系,32首Piano Sonata之后跟着33首变奏,有点crowning achievement的感觉,而且第33首变奏也和第32首Piano Sonata的Adagio联系紧密。 完整版的essay可以在这里读,是这本书里的第二篇essay:https://archive.org/details/musicsoundedout00alfr 另外也可以看这个视频,好像是Brendel的朗读版lol:https://www.youtube.com/watch?v=DmxFrzIxFqA #beethember#beethoven#brendel#essay