TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 8 слични објави

Пребарај: #southpark

当前筛选 #southpark清除筛选
Илья AGI TV 🤖

@ilia_plasma · Post #46 · 22.07.2023 г., 04:25

🎬 Ребятки из радужного штата создали приложение, которое по одному лишь промпту полностью создает и озвкучивает целую серию #SouthPark. В будущем (ну типа через пару тройку месяцев) планируется, что таким образом будут создаваться все анимированные мультипликации. Представляю сколько людей лишится работы в Голливуде, там 🏳️‍🌈 уже забастовки начались. Кстати, они симулировали еще и поведение между персонажами в мультике, типа попытка Cartoon AGI сделать. WhitePaper с описанием всех технологий под капотом, вроде все элементы уже знакомы. Directed by Robert B. Weide

Hashtags

爷青回动画分享频道

@Yeqingjie_GJG666 · Post #207 · 24.12.2021 г., 07:05

南方公园(1997) [前22季+剧场版] 【已全被和谐】 ◎年 代 1997-2018 ◎产 地 美国 ◎类 别 动画 / 成人 / 喜剧 ◎TMDB 8.7 ◎简 介 本剧是由特雷·帕克和马特·斯通为美国喜剧中心创作的成人动画讽刺剧集。整部剧集围绕着来自科罗拉多州南方公园镇的四名男孩——斯坦、凯尔、卡特曼和肯尼,以及他们在该小镇的种种冒险故事。与辛普森一家以及恶搞之家一样,南方公园里的角色都是该系列里的常客,也就是说他们会在几乎每一集获得出场机会。作为一部面向成人观众的动画节目,《南方公园》经常通过歪曲式的摹仿来讽刺和嘲弄美国文化和社会时事,挑战了许多根深蒂固的观念和禁忌,并因其中的粗口、黑色幽默和超现实幽默而著名。 大小:56.2 GB 标签:#南方公园#衰仔乐园#南方四贱客#SouthPark#动画#动漫#爷青回 链接:https://www.aliyundrive.com/s/SEM3CkKfHnr (详细资源目录与合集链接,见频道置顶消息) ————————————— 【爷青结动画分享交流群】 —————————————

💘Детали FR💘

@FRBravl · Post #600 · 25.05.2025 г., 06:35

❗️| Пост с хештегами 📗| Хештеги нужны что-бы Вам было легче ариентироваться по каналу. #️⃣| Список хештегов: #Разное — #Головы — #Волосы — #Лица — #Глаза — #Рты — #Аксессуары — #Руки — #Предметы — #Эффекты — #Мебель — #монстер — #осд — #борода — #животные #Набор #Праздник — #southpark — #символы по вопросам и и помощи пишите мне @reklamer НУЖНЫ НОВЫЕ АДМИНЫ

ХЭШТЕГИ →Этот пост будет обновляться! #genshinimpact #amodeladvisory #attackontitan #blackbutler #bungostraydogs #cappuccinoswithmarshmallows #chainsawman #cookierunkingdom #danganronpa #dokidokiliteratureclub #drstone #everlastingsummer #firecastssorrow #fullmetalalchemist #given #heavenofficialsblessing #howlsmovingcastle #inscryption #jojosbizarreadventure #komicantcommunicate #neongenesisevangelion #nyannyancantata #otters #secretalliance #SK8theinfinity #southpark #souleater #thegrandmasterofdemoniccultivation #theumbrellaacademy #thestrangerbythebeach #toiletboundhanakokun #tokyoghoul #tokyorevengers #toradora #violetevergarden #whomademeaprincess #windbreaker #yesnoormaybe #19DaysOneDay