TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 25 слични објави

Пребарај: #json

当前筛选 #json清除筛选
djangoproject

@djangoproject · Post #329 · 04.05.2017 г., 04:34

# The standard string repr for dicts is hard to read: »> my_mapping = {'a': 23, 'b': 42, 'c': 0xc0ffee} »> my_mapping {'b': 42, 'c': 12648430. 'a': 23} # 😞 # The "#json" module can do a much better job: »> import json »> print(json.dumps(my_mapping, indent=4, sort_keys=True)) { "a": 23, "b": 42, "c": 12648430 } # Note this only works with dicts containing # primitive types (check out the "pprint" module): »> json.dumps({all: 'yup'}) TypeError: keys must be a string

Hashtags

Android Broadcast

@android_broadcast · Post #8707 · 19.02.2025 г., 06:10

История(12м) как в Альфа-Банке сокращали размер JSON файла, который передается на устройство для работы SDUI. Решением стала шаблонизация для отказа от одинаковых блоков UI с разными данными #оптимизация#json

探索号

@seeker_rc · Post #20069 · 09.05.2026 г., 11:55

自造轮子分享, ai 国际化 json translate 小工具 ⦁ 核心功能:json 文件翻译 ⦁ 核心痛点:codex/cc 翻译国际化容易偷懒 + 慢,适合多语言 10+种语言使用 支持 BYOK (Bring Your Own Key),功能完全免费,实测下载 gpt 5.4 min 、gemini 2.5 flash 速度和性价比最高 省事也可以使用网站内置 ai ,按积分消耗,现在送 30 次翻译,不够用留下邮箱 再送 100 次翻译 [https://www.youtube.com/watch?si=aQ_8kp9e2lGlF39k&v=1Nf2Y_WdP4s&feature=youtu.be](https://www.... via V2EX 分享创造 标签: #AI#JSON#工具 ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。

拔毛工 🥸

@bamaogong · Post #918 · 01.10.2025 г., 05:46

#工具#JSON#可视化#开源 JSON Hero JSON 可视化工具,可自动解析字符串内容,并在树状视图、列视图、编辑视图间切换浏览,支持全文搜索与模糊匹配功能,可快速在键/值中定位信息,支持自动推断 JSON Schema(Draft 2020-12)并展示字段可能值分布,并为每个属性提供相关值视图,可识别 null 或缺失字段的边缘情况,还支持与 VS Code 集成,免费开源。 🧲 网站网址:http://jsonhero.io/

探索号

@seeker_rc · Post #20421 · 13.05.2026 г., 07:25

RawLens:嵌套 JSON 字符串格式化插件 大家好,2024 年底我在 V2EX 发过一个叫 Log Viewer 的 Chrome 插件: <https://www.v2ex.com/t/1098346> 当时主要是为了解决 Metabase / Datadog / Redash 里 JSON 日志和错误栈展示不友好的问题。 这段时间我把它改名并整理成了 RawLens ,代码、官网、截图和 Chrome Web Store 展示都重新做了一遍。现在核心方向更明确:在 Chrome 里快速格式化“到处来的 messy JSON”,尤其是这种情况: { "foo": "{"bar":1}" } 普通 JSON formatter... via V2EX 分享创造 标签: #JSON#Chrome#RawLens ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。

AppPie

@AppPie · Post #2348 · 05.03.2025 г., 04:06

#Developers JSON Crack: 开源的 JSON 编辑器 🔗GitHub JSON Crack 是一款将 JSON 数据可视化为交互式图表的开源工具,使探索、格式化和验证 JSON 变得更加简单。 主要功能 • JSON 可视化:将数据转换为交互式图表或树形结构,支持多种数据格式输入 • 数据转换:在 JSON、CSV、YAML、XML 等格式之间无缝转换,方便数据交换 • 格式化和验证:美化并验证 JSON、YAML 和 CSV 数据,提高可读性并查找错误 • 代码生成:自动生成 TypeScript 接口、Golang 结构体、Rust serde 和 JSON Schema • JSON Schema:验证 Schema、创建模拟数据,从各种格式生成 JSON Schema • 高级工具:解码 JWT、随机化数据,执行 jq 或 JSON 路径查询 • 图像导出:将可视化图表下载为 PNG、JPEG 或 SVG 格式,方便分享 • 安全性:所有数据在本地处理,不存储在服务器上,保障隐私安全 开源许可证 MIT license。 #GitHub#OpenSource#JSON#DataVisualization 📮 频道 @AppPie

BotsGram®

@botsgram_cu · Post #4164 · 05.08.2021 г., 14:31

¿Que puede hacer este bot? @apimaniaBot Con éste bot puedes crear PDF a partir de páginas web, convertir texto a imágenes, convertir tablas HTML a json y mucho más Idioma: español (Visto en @botsgram_cu) #pdf#web#texto#imágenes#hrml#json

ПретходнаСтраница 1 од 3Следна