TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #topik

当前筛选 #topik清除筛选
daily쌤

@dailyssaem · Post #3239 · 29.11.2024 г., 04:50

Вчера подъехали результаты топика учениц 🥹 Как-то это даже волнительнее, чем видеть свой 6급 кхмхахмха Особенно 4급 Тани, учитывая, что мы начинали путь корейского языка вместе. Помню, как она учила хангыль, а тут вот как получается… Как быстро растут ученики!! 😋😅 Сайт, кстати, вчера совершенно умер (но не в Корее, я смогла открыть для девочек результаты 💃) Все, кто сдавал в этот раз топик, вы оооочень хорошо постарались~ Не забудьте купить себе что-то вкусное в подарок 🍲 #topik

Hashtags

🇰🇷📚 TOPIK под угрозой: ответы на экзамен по корейскому продают за $5,000 💻 Вокруг международного экзамена по корейскому языку TOPIK разгорается серьёзный скандал. На китайской платформе Xiaohongshu массово продаются услуги по «гарантированной сдаче» теста — от получения ответов заранее до помощи прямо во время экзамена. 💰Схемы поставлены на поток. Брокеры предлагают: — ответы за 6–12 часов до экзамена с заявленной точностью до 90% — «сдачу экзамена за клиента» — помощь в реальном времени через микронаушник (около 1 мм) Цены доходят до 35 тыс. юаней (≈ $5,100) за доступ к заданиям и около 20 тыс. юаней ($2,900) за сопровождение во время теста. При этом обещают даже возврат денег, если «услуга» не сработает. 🕵️ По данным СМИ, посредники утверждают, что получают задания от сотрудников экзаменационных центров в Южной Корее. Более того, речь может идти о международной схеме: участники в более ранних часовых поясах (например, в Европе) запоминают вопросы и передают их брокерам, которые затем перепродают информацию тем, кто сдаёт экзамен позже. 🧠 Один из студентов подтвердил, что опубликованные в сети ответы частично совпали с реальными заданиями на экзамене. При этом по запросу «подготовка к TOPIK» на платформе обнаружено более 87,5 млн публикаций, и значительная часть из них связана с обходом правил. 📊 Экзамен TOPIK, который проводит National Institute for International Education, становится всё более массовым: в 2025 году он прошёл в 17 странах, а число участников достигло около 550 тыс. человек. Рост популярности сопровождается ростом злоупотреблений. ⚠️ Власти РК признают проблему: «Мы знаем, что происходит в соцсетях… но на 100% предотвратить это невозможно», — заявили в центре TOPIK. https://rg.ru/2026/04/15/korejskij-iazykovoj-ekzamen-topik-popal-v-centr-skandala-iz-za-prodazhi-otvetov.html #Корея#Новости#TOPIK#Образование

Fang的资源分享群

@FLMdongtianfudi · Post #15212 · 23.11.2025 г., 13:49

韩语入门至TOPIK高级 系统性讲解韩语学习的步骤与资源,帮助读者从基础到高级逐步掌握韩语,提高语言能力与考试通过率,实现语言目标。 🔗:https://pan.quark.cn/s/8d6076d127b6 #韩语学习#TOPIK#语言能力#基础入门#高级训练#学习资源 🔔Twitter👥频道💬群组

📢 ЛЕТНИЕ КУРСЫ подготовки к тестированию TOPIK 🇰🇷 В нашем центре, в летний период будут открыты группы подготовки к сдаче тестирования TOPIK (I и II уровня). Это связано с тем, что этим летом - 10 июля, в Санкт-Петербурге пройдет сдача экзамена TOPIK. ✅ Будут открыты две группы: 1. Подготовка к тестированию TOPIK I (1-2 гып) 2. Подготовка к тестированию TOPIK II (3-6 гып) 💥 Условия обучения - Онлайн формат обучения (через ZOOM) - 8 недель обучения - с 14 мая по 02 июля - Расписание: суббота с 13:00 до 14:40 - Стоимость: 8 000 рублей. 📍Условия поступления: - Заявки будут рассматривать только после того, как их количество составит 10 и более; - Поступить на курсы может любой желающий; - Оплата производится после одобрения заявки, через платформу Дзен-класс; - Прием заявок и оплаты СТРОГО до 12.05.2022. 🌐 Ссылки для подачи заявки опубликованы на нашем сайте: http://www.wonkwang.ru/receipt ❗ ВНИМАНИЕ - Наш учебный центр не проводит экзамен TOPIK; - Всю информацию по проведению тестирования TOPIK уточняйте в посольстве Республики Корея; - Учебный центр не консультирует по вопросам подачи заявок на тестирование. #корейскийязык#корея#школа#языки#лингвистика#хочувкорею#сеул#учукорейский#kpop#bts#exo#blackpink#korea#korean#seoul#topik