TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #waaw

当前筛选 #waaw清除筛选

The World Antimicrobial Resistance Awareness Week #WAAW starts today Every 18th - 24th of November is dedicated to improving awareness and understanding of #AntimicrobialResistance. Join the global movement. Together, we can prevent #AntimicrobialResistance. #AMRactionNG

Cerdas Gunakan Obat

@cerdasgunakanobat · Post #3461 · 17.11.2019 г., 12:40

Antibiotik bukan penggemuk hewan! Yuuks, check this video and like: https://youtu.be/NYxJshcaWO0 Video tersebut dibuat oleh Apoteker Ayunina Rizki (Apotek Royal, Sleman), Master AoC GeMa CerMat DI Yogyakarta, dalam rangka Lomba Vlog "Kendalikan Resistensi Antibiotik di Dunia Peternakan" yang diadakan oleh Kementerian Pertanian. Yuk saksikan videonya yang sangat informatif dan edukatif, membahas Penggunaan Antibiotik pada hewan ternak. Jangan lupa like, comment Dan share juga yaaa...! #bijakcerdasantibiotik #WorldAntibioticAwarenessWeek #WAAW #WAAW2019 #BeAntibioticSmart #FightAntimicrobialResistance

Cerdas Gunakan Obat

@cerdasgunakanobat · Post #3457 · 13.11.2019 г., 13:26

Simak siaran radio dari Fakultas Kedokteran Universitas Indonesia tentang "Gunakan Antibiotik dengan Bijak" dalam rangka "World Antibiotic Awareness Week 2019" Di RRI Pro 92,2 FM, Hari Selasa, 19 November 2019 pukul 11.20 - 11.55 WIB. #WAAW#WorldAntibioticAwarenessWeek#bijakantibiotik#gemacermat#cerdasgunakanobat #apotekerindonesia#apotekermuda#apoteker#obat#antibiotik#farmasi#anakfarmasi#mahasiswafarmasi#ismafarsi

Cerdas Gunakan Obat

@cerdasgunakanobat · Post #3458 · 13.11.2019 г., 14:39

[World Antibiotic Awareness Week] . https://www.instagram.com/p/B4zuP0RpERr/?igshid=j3jrciyk4rz3 . https://www.facebook.com/864416113651534/posts/2517062995053496/?substory_index=0 . Setiap tahun di seluruh dunia dilaksanakan kegiatan peningkatan kesadaran dan pemahaman tentang Resistensi Antimikroba dan penggunaan antibiotik secara bijak di seluruh dunia. . Kegiatan yang diselenggarakan selama seminggu di bulan November dan diinisiasi oleh Badan Kesehatan Dunia (WHO) ini yang dikenal sebagai World Antibiotic Awareness Week (WAAW), diperingati juga di Indonesia. . Tim Pelaksana Program Pengendalian Resistensi Antimikroba (PPRA) RSUPN Dr Cipto Mangunkusumo (RSCM) bersamaan dg HUT yg ke-100 memperingati WAAW 2019 dengan berbagai kegiatan. Salah satunya yaitu siaran radio dengan topik "Gunakan Antibiotik dengan Bijak" . Siaran ini dapat disimak di RRI Pro-FKUI 92,2 FM, pada hari Selasa, 19 November 2019 pukul 11.20 - 11.55 WIB. Jadi, catat waktunya, stay tuned dan jangan ketinggalan ya! Jangan lupa juga untuk dibagikan sebanyak-banyaknya. Yuukk gunakan antibiotik dengan Bijak, selamatkan anak cucu kita dari bakteri resisten. . Informasi ini disiarkan oleh Direktorat Pelayanan Kefarmasian, Ditjen Kefarmasian dan Alat Kesehatan Kementerian Kesehatan RI dalam rangka Gerakan Masyarakat Cerdas Menggunakan Obat (GeMa CerMat). Fanpage FB: Cerdas Gunakan Obat Twitter & IG: @gemacermat Telegram: http://t.me/cerdasgunakanobat , http://t.me/diskusiobat Email: [email protected] • #gemacermat#cerdasgunakanobat #WAAW#WorldAntibioticAwarenessWeek#bijakantibiotik #apotekerindonesia#apotekermuda#apoteker#obat#antibiotik#farmasi#anakfarmasi#mahasiswafarmasi#ismafarsi #WAAW2019 #PPRARSCM