@Ptfxq · Post #212 · 19.06.2021 г., 23:29
#ABN#开放邀请 ABN是一个法国综合站,同时也是法国最好的 PT 站点之一。在之前,即使有幸可以获得 ABN 的邀请,依然需要在 IRC 面试。但本次开放邀请无需面试,在发布本条消息时,开邀剩余时间还剩17小时。 另附公告原文。 https://telegra.ph/Ouverture-des-invitation-direct-06-19
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #121 · 20 јул.
Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django
Пребарај: #abn
@Ptfxq · Post #212 · 19.06.2021 г., 23:29
#ABN#开放邀请 ABN是一个法国综合站,同时也是法国最好的 PT 站点之一。在之前,即使有幸可以获得 ABN 的邀请,依然需要在 IRC 面试。但本次开放邀请无需面试,在发布本条消息时,开邀剩余时间还剩17小时。 另附公告原文。 https://telegra.ph/Ouverture-des-invitation-direct-06-19
@Ptfxq · Post #598 · 28.02.2024 г., 16:09
#没用的外站信息 可能会被群友说是没用的外站信息,就合并到一起发了。 ———— #SC#SecretCinema#站点公告 We have a new IRC channel that we actually control. Server: irc.brokensphere.net:6697 Channel: #secretcinema Use site nick especially if you require assistance. Please don't use the #sc channel for assistance or help with your account as staff will no longer idle in this chat. TLDR; SC 更换了 IRC 的域名。 ———— #shazbat#站点公告 2024-02-25 - Webchat broken As you might have noticed, the webchat is a bit broken. We are working on fixing it, but it might take some time. If you want a good chat experience, join IRC (see the help pages). TLDR; webchat 炸了,要聊天就来 IRC。 ———— #ABN#站点免费 站免还剩 8 天+ ———— #HeBits#站点免费 站免还剩 1 天+ ———— #AcidLounge#站点公告 Hey all, We had over 10 accounts that someone took advantage of maybe from stolen database from another site. These peeps have now lost there account. So please don't use the same password as other sites maybe consider using Two Factor Authentication (2FA) which can be setup in your settings. You can use an app like Authy https://authy.com/what-is-2fa/ TLDR; 有人号被盗了,记得开 2FA。