TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 4 слични објави

Пребарај: #gmo

当前筛选 #gmo清除筛选
Venezuelanalysis

@venanalysis · Post #2053 · 05.08.2025 г., 21:14

📝 INTERVIEW | Seeds, GMOs and Sovereignty: A Conversation with Esquisa Omaña Venezuelan researcher and activist Esquisa Omaña takes stock of the country's Seed Law and the struggle for food sovereignty. Approved in 2015, the Seed Law bans the sowing of GMOs and uniquely recognizes two knowledge systems: certified seeds and those developed by campesino, Indigenous, and Afro-descendant communities. But a decade later, Omaña warns that the law remains largely unimplemented. The biosecurity commission never took off, and the GMO detection lab remains unopened. As GMO imports continue and local varieties face contamination risks, the law’s vision, to protect agro-biodiversity and campesino knowledge, hangs in the balance. 🔗 Read the full interview here: https://shorturl.at/eGGWP #FoodSovereignty#GMO#SeedLaw

科技&趣闻&杂记

@kejiqu · Post #4081 · 19.01.2026 г., 08:22

Jeremy Grantham 称 AI 确实是一个典型的市场泡沫 GMO 联合创始人 Jeremy Grantham 认为,当前市场存在人工智能 (AI) 泡沫。这位以准确预测市场泡沫而闻名的投资者,曾成功预警过 1980 年代的日本股市、2000 年的美国科技股以及 2008 年金融危机前的房地产泡沫。 Grantham 在 Merryn Talks Money 播客中表示,他认为当前 AI 市场存在泡沫迹象。Bloomberg 🏷#Jeremy#Grantham#AI#GMO 📢频道👥群组📝投稿

比特云-通知频道

@biteyunNews · Post #137 · 07.05.2020 г., 17:16

续费9折优惠码 Sdg3r5av [购买订阅](https://bityun.org/#/plan) 回馈给大家,感谢大家对比特云的支持,我们会做的更好! ⚠️#流量每月1号重置 , 续费流量不会重置,本月流量用完请使用 #流量重置包 重置本月流量,不理解的请自行退群,再问直接飞机票 ⚠️#工单系统故障,没有及时处理的工单请私聊客服 @mengshenx 处理,记得带上账号和问题 ❤️新增 #流量重置包,点击官网我的订阅->操作->重置流量即可 ❤️新增 #日本, #韩国, #香港#AWS 节点 ❤️新增 #日本#GMO 节点, 原生IP 解锁日本流媒体 可看 #Netflix#Ameba 欢迎大家体验反馈 请关注官方通知频道过去最新动态 https://t.me/biteyunNews

比特云-通知频道

@biteyunNews · Post #139 · 08.05.2020 г., 04:01

续费9折优惠码 Sdg3r5av [购买订阅](https://bityun.org/#/plan) 回馈给大家,感谢大家对比特云的支持,我们会做的更好! ⚠️#流量每月1号重置 , 续费流量不会重置,本月流量用完请使用 #流量重置包 重置本月流量,不理解的请自行退群,再问直接飞机票 ⚠️#工单系统故障,没有及时处理的工单请私聊客服 @mengshenx 处理,记得带上账号和问题 ❤️新增 #流量重置包,点击官网我的订阅->操作->重置流量即可 ❤️新增 #日本, #韩国, #香港#AWS 节点 ❤️新增 #日本#GMO 节点, 原生IP 解锁日本流媒体 可看 #Netflix#Ameba ⚠️#更新订阅请使用 国内网络 或本站节点 ⚠️#订阅转换认证网站 https://gfwsb.114514.best https://bianyuan.xyz/ 欢迎大家体验反馈 请关注官方通知频道过去最新动态 https://t.me/biteyunNews