TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #65 · 8 апр.

Небольшой трик с регулярными выражениями который редко вижу в чужом коде. Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста. >>> text = ''' >>> Alex:8999123456 >>> Mike:+799987654 >>> Oleg:+344456789 >>> ''' Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн: (\w+):([\d+]+) Как мы будем формировать словарь из найденных групп? >>> import re >>> results = [] >>> for match in re.finditer(r"(\w+):([\d+]+)", text): >>> results.append({ >>> "name": match.group(1), >>> "phone": match.group(2) >>> }) >>> print(results) [{'name': 'Alex', 'phone': '8999123456'}, ...] Можно немного сократить запись используя zip >>> results = [] >>> for match in re.finditer(r"(\w+):([\d+]+)", text): >>> results.append(dict(zip(['name', 'phone'], match.groups()))) Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря. >>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text): >>> results.append(match.groupdict()) То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись: (?P<group-name>...) Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка >>> name = match['name'] Либо забрать сразу весь словарь методом groupdict() >>> match.groupdict() #tricks#regex

Резултати

Пронајдени 2 слични објави

Пребарај: #html2rss

当前筛选 #html2rss清除筛选
ALL About RSS

@AboutRss · Post #795 · 03.09.2020 г., 01:00

HTML2RSS : 通过 CSS 选择器来生成 RSS feed #HTML2RSS 是一款为没有 RSS 的网站生成 RSS feed 的 #开源 项目,使用方式一点也不平民,而是比较偏程序员一些。除了要自建服务外,还需要为目标网站写一个基于 CSS 选择器的 .yml config 文件。好在官方放出了数十个该项目做好的 RSS feed: https://html2rss.github.io/configs/

ALL About RSS

@AboutRss · Post #1359 · 16.08.2023 г., 07:00

「用 RSSHub 替代 Feed43」 为了让 #RSSHub 能够规则化地将任意的 HTML 和 JSON 转换为 RSS,Wechat2RSS 作者贡献了代码,且已并入 RSSHub。 原理是在路由生成过程中引入 CSS 选择器 / JSON Path 进行内容提取。作者写了教程并附上了小工具: https://t.me/allaboutrss/13105 官方文档: https://docs.rsshub.app/routes/other#zhuan-huan P.S. RSS Bridge 亦已支持此类功能: https://rss-bridge.org/bridge01/#bridge-CssSelectorBridge P.P.S. 基于 CSS 选择器的 #HTML2RSS 工具还有: 🔸HTML2RSS 🔸Feed me up, Scotty! 🔸Feedmaker 🔸Feed Creator