TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #infokesehatan

当前筛选 #infokesehatan清除筛选
Cerdas Gunakan Obat

@cerdasgunakanobat · Post #3673 · 06.06.2020 г., 09:04

Pertolongan Pertama pada Masalah Kesehatan di Rumah . https://www.instagram.com/p/CBFiw27p586/?igshid=xcbgrvqf3qa4 . Siapa sih yang mau sakit? Gak ada kan, ya? Semua orang maunya sehat dan terhindar dari penyakit, apalagi yang namanya Covid-19. Jauh-jauh deehh... . . Tapiiii...kalo ternyata Kita udah berupaya mencegah supaya tidak sakit, ternyata masih ada aja masalah kesehatan yang dihadapi saat di rumah, repot juga dalam kondisi begini. Entah itu kecelakaan kecil, penyakit kulit, demam, kejang, diare, nyeri sendiri, eeh..sendi, lumayan bikin pusing ya? . . Yuk kita bahas tuntas dalam program SEIMAN yang ke-5 bersama dr. Agustiawan @agustiawan28 dan Kak apt. Erie Gusnellyanti, MKM @nellysyukri . Live di IG @infokom.farmasi Minggu, Juni 2020 Pukul 15.30 - 16.30 WIB. . . GRATIS dan BERHADIAH LHO!!! Syaratnya: Follow 3 akun berikut: - @infokom.farmasi - @inpharcom.bukukesehatan - @nellysyukri . . Sebarkan yaaa.. . . IG @infokom.farmasi Twitter @infokom.farmasi FB 'Informasi Kefarmasian dan Kesehatan' Email: [email protected] . . . #infokefarmasian#infokesehatan #inpharcom#bukukesehatan#bukufarmasi#gemacermat#cerdasgunakanobat#demam#kejang#diare#p3k#nyerisendi#kecelakaan#penyakitkulit

Cerdas Gunakan Obat

@cerdasgunakanobat · Post #3666 · 20.05.2020 г., 15:54

https://www.instagram.com/p/CAah59lJUpJt1SyIcjSI4F-KFIhgsSSFBw0d380/?igshid=1qvycu8wnl1ll . https://m.facebook.com/story.php?story_fbid=10224747250090873&id=1300855885 . . Assalamualaikum wr wb . . Bapak/Ibu/teman2, jangan lupa besok siang, Kamis, 21 Mei 2020, pukul 13.00 - 14.00 WIB, saksikan siaran LIVE Saya dalam program SEIMAN yang ke-3 bersama dr. Ronny Hadyanto di akun @infokom.farmasi Kami akan "Ngobrol Santai Soal ISPA", kupas tuntas masalah kesehatan tersering dan terbanyak di tengah masyarakat hingga saat ini, termasuk saat Pandemi Covid-19. . . GRATIS dan BERHADIAH SOUVENIR MENARIK dari @inpharcom.bukukesehatan bagi peserta yang bertanya dan beruntung. . . Syaratnya: 1. Follow 3 akun berikut: - @infokom.farmasi - @inpharcom.bukukesehatan - @nellysyukri . 2. Repost flyer ini di akun medsos masing-masing. . 3. Tag/mention minimal 3 akun temanmu. . . Sebarkan yaaa.. . . IG @infokom.farmasi Twitter @infokom.farmasi FB 'Informasi Kefarmasian dan Kesehatan' Email: [email protected] . #infokefarmasian#infokesehatan #inpharcom#bukukesehatan#bukufarmasi#gemacermat#cerdasgunakanobat#ispa#commoncold#batukpilek#influenza#flu#sinusitis#otitismedia#pneumonia#covid19#lawancovid19

Cerdas Gunakan Obat

@cerdasgunakanobat · Post #3665 · 20.05.2020 г., 02:58

Ngobrol Santai Soal ISPA . . https://www.instagram.com/p/CAZMLb9JllK/?igshid=1hbv6y0kyd08y . . https://m.facebook.com/story.php?story_fbid=130671945267435&substory_index=0&id=103148744686422 . . ISPA? Istri Setia Pendiam dan Amanah? Bukaaaannn... Infeksi Saluran Pernapasan Atas? Bukaaaan..... Yang benar ISPA itu Infeksi Saluran Pernapasan Akut. Trus ada apa dengan ISPA? . . ISPA itu salah satu penyakit terbanyak dan tersering dijumpai di tengah masyarakat. Masalahnya apa? Masalahnya, ada banyak jenis ISPA. GAK SEMUANYA BUTUH DIOBATI. DAN GAK SEMUANYA BUTUH ANTIBIOTIK. . . Salah satu gejala ISPA yang jadi momok belakangan ini yaitu Covid-19 yang disebabkan oleh virus SARS-COV2, yang sebenarnya gak ganas. Tapi penyebarannya yang cepat sekali meluas, hingga banyak korban yang tewas. . . Mau tau lebih banyak tentang ISPA? Yuk kita bahas tuntas dalam program SEIMAN yang ke-3 bersama dr. Ronny Hadyanto, dimoderatori langsung oleh Kak @nellysyukri Live di IG @infokom.farmasi Kamis, 21 Mei 2020 Pukul 13.00 - 14.00 WIB. . . GRATIS dan BERHADIAH SOUVENIR MENARIK!! Syaratnya: 1. Follow 3 akun berikut: - @infokom.farmasi - @inpharcom.bukukesehatan - @nellysyukri 2. Repost flyer ini di akun medsos masing-masing. 3. Tag/mention minimal 3 akun temanmu. . . Sebarkan yaaa.. . . IG @infokom.farmasi Twitter @infokom.farmasi FB 'Informasi Kefarmasian dan Kesehatan' Email: [email protected] . #infokefarmasian#infokesehatan #inpharcom#bukukesehatan#bukufarmasi#gemacermat#cerdasgunakanobat#ispa#commoncold#batukpilek#influenza#flu#sinusitis#otitismedia#pneumonia#covid19#lawancovid19