TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 8 слични објави

Пребарај: #pennsylvania

当前筛选 #pennsylvania清除筛选
ℭ𝔬𝔪𝔟𝔞𝔱𝔩𝔳𝔩™

@realcombatlvl · Post #24520 · 29.07.2025 г., 20:40

🇺🇸 Logan Riley and Brandon Mitchell went viral over the weekend after a video was shared of them showcasing their crowdfunded surrogacy baby. “Brandon Keith Mitchell is a Tier 1 sex offender in the state of #Pennsylvania, and was arrested in 2016 after attempting to solicit a 16-year-old boy for sexual abuse,” the outlet reports Reduxx. Follow us -> LiveLeak

Tibicen

@world_music_geek · Post #27 · 19.09.2020 г., 12:28

George Britton — Pennsylvania Dutch Folk Songs (Folkways Records, 1955) #traditional#guitar#Pennsylvania#United_States Профессиональный оперный певец Джордж Бриттен родился в Рединге, Пенсильвания. Наследие Бриттена вдохновило его на поиски и изучение музыки его родных мест – песен, которые представляют собой виньетки его пенсильванского детства, от частушек о «раздражающих вечеринках» до стихотворений в честь праздника Фастнахт. Песни исполнены на Пенсильванском немецком языке — разновидности западно-центрально-немецкого языка, на котором говорят потомки немецких иммигрантов в США и Канаде, тесно связанные с палатинскими диалектами. В США и Канаде проживает более 300 000 носителей этого языка. В Пенсильвании 29,9% населения в настоящее время заявляют о немецком происхождении. Вопреки распространенному мнению, слово «dutch» в «Pennsylvania dutch» не является неправильным переводом, а скорее искажением пенсильванско-немецкого эндонима «deitsch», что означает «Пенсильванский немецкий» или «немецкий». Практика Пенсильванского немецкого языка в городских районах Пенсильвании (таких как Аллентаун, Рединг, Ланкастер и Йорк) сокращалась с приходом 20-го века, в то время как в более сельских районах он продолжал широко использоваться во время Второй мировой войны. С того времени его использование значительно сократилось. Spotify | AppleMusic

American Оbserver

@american_observer · Post #5723 · 26.04.2026 г., 23:59

📰 AI’s New Frontier Is a Small Town’s Backyard Archbald, Pennsylvania has become the kind of place where “progress” arrives with chainsaws, diesel generators, and a brochure. Developers want six data center campuses on about 14 percent of the town’s land, and residents are left wondering why an AI boom has to look like a land grab. The pitch is classic corporate folklore: jobs, tax revenue, future, optimism. The reality is less glossy — forests cut down, neighbors pushed close to massive warehouses, and a community suddenly asked to absorb the noise, water demand, and grid strain for an industry that won’t even say which tech firms will move in. What makes Archbald interesting is that the backlash is not just environmental. It is political, emotional, and deeply local, with residents flooding meetings, forcing resignations, and turning a sleepy borough into a referendum on who gets to decide the future of a town. That’s why the fight keeps spreading. Data centers are being sold as invisible infrastructure, but people living next to them are discovering they are anything but invisible once the stumps, generators, and property lines show up. So the AI economy’s clean little slogan runs into the oldest American response: not here, not on our land, and not without a real answer about who pays the price. #AI#dataCenters#Pennsylvania#Archbald#development#localpolitics 📱American Оbserver - Stay up to date on all important events 🇺🇸

Tibicen

@world_music_geek · Post #738 · 03.09.2024 г., 09:05

Регионы #Alsace#Auvergne#Castile#England#Guadeloupe#Martinique#Ngazidja#Occitania#Pennsylvania#Rajasthan#Reunion#Scotland#Sicily#Tibet#Trinidad#Tuva#West_Indies#Zanzibar#Bryansk#Arkhangelsk#Fashaga#Altai