TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 5 слични објави

Пребарај: #ets

当前筛选 #ets清除筛选

💥 “Yangi O‘zbekiston” universitetining Uzluksiz ta'lim markazi Buyuk Britaniyaning ETS tashkilot tomonidan tan olindi 🤝 Endilikda, Markaz SAT, TOEFL va TOEIC sertifikatlari uchun imtihon o‘tkazish vakolatiga ega bo‘ldi. ➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖ Continuing Education Center at New Uzbekistan University has become an Authorized ETS Testing Center for TOEFL & TOEIC 🤝 As a result of long-standing networking with ETS, the University's Continuing Education Center has been authorized to conduct exams and provide certification for SATTOEFL and TOEIC. #ETS#TOEFL#TOEIC ⬇️Biz ijtimoiy tarmoqlarda: Veb-sayt | Telegram | Instagram | Facebook

NEWS 鏈新聞-ABMedia

@abmedia_news · Post #24075 · 23.04.2026 г., 08:30

【🚀 AI 人工智慧|AI重塑高等教育版圖,可汗學院攜手 TED 與 Google 籌辦全新 AI 學院 】 #TED#ETS#Google 📍 請見報導: https://abmedia.io/khan-ted-academy 📍 訂閱鏈新聞頻道:https://linktr.ee/abmedia.io

💥 “Yangi O‘zbekiston” universitetining Uzluksiz ta'lim markazi Buyuk Britaniyaning ETS tashkilot tomonidan tan olindi 🤝 Endilikda, Markaz TOEFL va TOEIC sertifikatlari uchun imtihon o‘tkazish vakolatiga ega bo‘ldi. ➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖➖ Continuing Education Center at New Uzbekistan University has become an Authorized ETS Testing Center for TOEFL & TOEIC 🤝 As a result of long-standing networking with ETS, the University's Continuing Education Center has been authorized to conduct exams and provide certification for TOEFL and TOEIC. #ETS#TOEFL#TOEIC ⬇️Biz ijtimoiy tarmoqlarda: Veb-sayt | Telegram | Instagram | Facebook

Andijan Development Center

@adceducate · Post #9414 · 05.04.2025 г., 14:19

🔖🤝ADC да катта янгилик Андижонда ягона TOEFL маркази очилиши ва TOEFL iBT ҳамда GRE имтиҳонлари бўйича БЕПУЛ семинар! 🎓 📢 Халқаро имтиҳонларни муваффақиятли топшириш сирларини билишни истайсизми? Andijan Development Center ва ETS ҳамкорлигида ташкил этиладиган ушбу эксклюзив тадбирда иштирок этинг! 🗓 Сана ва вақт: 2025 йил 11 апрель, соат 13:00 — 15:00 📍 Жойи: Andijan Development Center, 19А-уй, Андижон шаҳри, Ўзбекистон 🌍 Тиллар: Инглиз тили 🇬🇧 ва Ўзбек тили 🇺🇿 🎟 Кириш: Бепул (олдиндан рўйхатдан ўтиш талаб қилинади) ✨ Тадбир дастури: 📘 TOEFL iBT ва GRE имтиҳонлари ҳақида тўлиқ маълумот 🔍 Тузилиши, баҳолаш мезонлари ва имтиҳоннинг афзалликлари ҳақида билиб олинг 🎯 Тайёргарлик стратегиялари 📚 Барча бўлимлар бўйича мутахассисларнинг фойдали маслаҳатлари ❓ Савол-жавоб сессияси 💬 Спикерлардан бевосита ўзингизни қизиқтирган саволларга жавоб олинг 🎁 Иштирокчилар учун бонуслар: ✅ TOEFL iBT имтиҳони учун эксклюзив чегирма коди 🏆 TOEFL iBT учун бепул ваучер ва TOEFL Practice Onlineга кириш имконини ютиб олинг ✨ Спикерларимиз: 👩‍💼 Анна Гутковска-Заянц – ETS EMEA нинг Евроосиё ва Марказий Осиё бўйича минтақавий директори 👨‍🏫 Геннадий Владимирович Морозов – Andijan Development Center асосчиси ва директори 👩‍💼 Шолпан Ергалиева – ETSнинг Марказий Осиёдаги расмий вакили 🚀 Имкониятни қўлдан бой берманг – келажакдаги академик ва касбий муваффақиятингиз сари йўлни бошланг! 🔗 Рўйхатдан ўтиш ва батафсил маълумот: 👉https://etsglobal-26271412.hs-sites-eu1.com/en/ca-toefl-event-apr11 Рўйхатдан ўтиш ва маслахат: 📞 74-226-1078 📺@admofadc 📱Telegram📱Instagram📱Facebook📱TikTok📱YouTube #TOEFL#GRE#ETS#ADC#AndijanEvent#AndijanDevelopmentCenter#ИнглизТили#Таълим#ЧетЭлдаТаҳсил

Andijan Development Center

@adceducate · Post #9419 · 10.04.2025 г., 14:12

🌟 TOEFL iBT va GRE TEST MARKAZIMIZNING TANTANALI OCHILISH MAROSIMI! 🌟 📅 2025-yil 11-aprel 📍 O‘tkazilish joyi: Hotel Branch — Mashrab 19A, Andijon (3-kichik daha) Ertaga Andijonda ta’lim tarixida yangi sahifa ochiladi! Biz faxr bilan e’lon qilamiz — TOEFL iBT va GRE xalqaro testlari uchun rasmiy imtihon markazi endi ADC ochiladi! 🇺🇸📘🎓 Ushbu markaz ETS (Educational Testing Service) bilan hamkorlikda tashkil etilgan bo‘lib, minglab yoshlarimizga OTMlarga kirish yo‘lini ochadi. 🌍 Endi xalqaro darajadagi imtihonlar — TOEFL iBT va GRE — sizga yanada yaqin, aynan Andijonda! 🎤 Tadbirda: ETS vakillari Viloyat va shahar hokimligi hamda Ta’lim boshqarmasi rahbarlari Ommaviy axborot vositalari Ilhomlantiruvchi nutqlar Imtihon markazi bo‘ylab ekskursiya Intervyu va press-momentlar 📢 Bu nafaqat markaz ochilishi, bu — butun viloyat yoshlari uchun xalqaro eshiklarning ochilishi! Kelajak sizni kutmoqda — birinchilardan bo‘lib shu tarixiy daqiqaning guvohiga aylaning! 📍 Andijon Taraqqiyot — xalqaro ta’lim sari yo‘lingiz shu yerdan boshlanadi. #TOEFL#GRE#TOEFLiBT#ETS#AndijonTaraqqiyot#Ta’lim #XalqaroTestlar#AndijondaImtihonMarkazi#KelajakBuYerdaBoshlanadi 📞 74-226-1078 📺@admofadc 📱Telegram📱Instagram📱Facebook📱TikTok📱YouTube