TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 6 слични објави

Пребарај: #springernature

当前筛选 #springernature清除筛选
100K20

@science_100k20 · Post #173 · 02.02.2024 г., 12:11

#SpringerNature#Springerlink#вебинар Вебинар от издательства Springer Nature о платформе Springerlink Издательство Springer Nature приглашает пользователей на вебинар, посвящённый платформе Springerlink. Дарья Савельева, представитель Springer Nature, расскажет об эффективном использовании инструментов платформы для поиска и работы с онлайн-ресурсами издательства. В ходе вебинара будет затронут вопрос про обновление интерфейса платформы Springerlink. Вебинар состоится 8 февраля в 10:00 (время московское). Информация о вебинаре и ссылка для регистрации опубликованы в разделе Вебинары нашего сайта. Work illustrations by Storyset

100K20

@science_100k20 · Post #100 · 29.09.2023 г., 15:03

Семинар Springer Nature 🔔 28 сентября состоялся семинар для сотрудников Государственной публичной научно-технической библиотеки России и их коллег. Команда 100К20 рассказала о возможностях ресурсов Springer Nature, а также о публикациях в международных журналах. В ходе семинара была продемонстрирована практическая часть по работе с платформой Springerlink, на которой были разобраны наглядные примеры. На семинаре также были представлены полезные ресурсы и инструменты как для библиотекарей, так и для исследователей и авторов. Напоминаем, что Springer Nature является одним из крупнейших в мире издателей научных журналов и книг по различным областям исследований, чьи ресурсы доступны российским организациям в рамках национальной подписки. #семинар#библиотека#SpringerNature#электронныересурсы

Библиотека ХГУ

@libkhsu · Post #91 · 02.11.2023 г., 03:05

#SpringerNature#инструментыдляавторов#публикация Издательство Springer Nature анонсировало запуск нового сервис-помощника Curie на базе искусственного интеллекта, который поможет исследователям улучшить качество научных текстов на английском языке. Curie доступен для всех авторов при подготовке статей к публикации в журналах Springer Nature и особенно будет полезен тем, для кого английский язык не является родным. Веб-сервис сочетает в себе возможности больших языковых моделей (LLM) со специализированным цифровым редактированием, предназначенным специально для академического письма. Подробная информация опубликована на нашем сайте в разделе Новости. Worker illustrations by Storyset

100K20

@science_100k20 · Post #168 · 24.01.2024 г., 13:44

#SpringerNature#InReview#инструментыдляавторов #публикация Издательство Springer Nature сообщает, что более 1000 журналов, включая серию журналов открытого доступа Discover Journals, интегрированы с сервисом препринтов «In Review». In Review разработан компанией Research Square в сотрудничестве со Springer Nature и входит в портфолио издательских услуг Springer Nature с октября 2018 г. Сервис «In Review» позволяет обмениваться информацией, а также делает процессы подачи рукописей и рецензирования статей более прозрачными для авторов. Авторы, использующие данный сервис, могут ссылаться на свою работу и делиться ею, пока она находится на стадии рецензирования, а также получать обновления в режиме реального времени о статусе рецензирования. Springer Nature также сообщает, что до конца года ещё более 100 журналов будут интегрированы с «In Review». Подробнее о сервисе «In Review» можно узнать на сайте Springer Nature. Data illustrations by Storyset

100K20

@science_100k20 · Post #111 · 23.10.2023 г., 12:53

Предлагаем ознакомиться с графиком вебинаров от ведущих международных издательств на ближайшую неделю: 📅25 октября 2023 в 11:00 и 21:00 (мск) ✅CAS | Вероятностные модели и их применение Регистрация доступна по ссылке. 📅26 октября 2023 в 17:00 (мск) ✅Questel | Продвинутый тренинг по Orbit Intelligence Регистрация доступна по ссылке. 📅26 октября 2023 в 18:00 (мск) ✅Springer Nature | Редактирование статьи онлайн Регистрация доступна по ссылке. #вебинар#исследования#электронныересурсы#наука#библиотека#публикации#CAS#Questel#SpringerNature

100K20

@science_100k20 · Post #79 · 14.08.2023 г., 11:17

Предлагаем ознакомиться с графиком вебинаров от ведущих международных издательств на этой неделе: ✅Springer Nature | Публикация в международном издательстве 📅 15 августа 2023 в 12:00 (мск) Регистрация доступна по ссылке. ✅World Scientific | Исследования в области Математических наук в World Scientific 📅16 августа 2023 в 11:00 (мск) Регистрация доступна по ссылке. ✅SAE International | Вебинар-интервью от SAE International 📅16 августа 2023 в 18:00 (мск) Регистрация доступна по ссылке. ✅AMS | Работа на платформе MathSciNet 📅17 августа 2023 в 12:00 (мск) Регистрация доступна по ссылке. #вебинар#исследования#цитирования#электронныересурсы#наука#библиотека#публикации#SpringerNature#WorldScientific#SAEInternational#AMS