Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
🩸🩸🩸🩸🫵🩸🩸
🎬The Penguin series based on the latest Batman has received 91% on Rotten Romatoes. Critics are delighted with Colin Farrell's transformation and call his character the Tony Soprano of the DC Comics world. JoBlo gave the series 10/10, and one critic even called Penguin the best series of the year.
The season will have 8 episodes. The first episode of the series will be released on streaming on September 19, and the last one - on November 10.
It seems that we have a contender for the main comic book series of 2024 🚬
#Penguin#Batman#DCComics
MARKHEMIST
DC Legion of Super Heroes Season 2
📅Año Septiembre 2007 - Mayo 2008
🎥Dirección Ben Jones, Tim Maltby, Lauren Montgomery, Scott Jeralds, James Tucker, Brandon Vietti
📄Guion Tim Cahill, Julie McNally Cahill. J.M. DeMatteis, Matt Wayne. Michael Jelenic, Rob Hoegee, Scott Sonneborn, Amy Wolfram, Stan Berkowitz, Steven Melching, John Esposito, Keith Damron, Eddie Guzelian, Rob Hummel, Marty Isenberg, Joseph Kuhr, David Slack, Greg Weisman
🎼Música Kristopher Carter, Michael McCuistion, Lolita Ritmanis
🎬Productora Warner Bros. Animation
Género#SeriedeTV#Animación#Acción#Comedia#Superhéroes#Cómic#DCComics
Reparto / Trailer / Premios
⏱Duración 22min.
🖥Resolución 720x400
🗣Idioma Inglés
Subtítulos Latino
Season 2 Episodio01 / 02 / 03 / 04 / 05 / 06 / 07 / 08 / 09 / 10 / 11 / 12 / 13
Season1
DC Legion of Super Heroes Season 1
📅Año Septiembre 2006 - Mayo 2007
🎥Dirección Ben Jones, Tim Maltby, Lauren Montgomery, Scott Jeralds, James Tucker, Brandon Vietti
📄Guion Tim Cahill, Julie McNally Cahill. J.M. DeMatteis, Matt Wayne. Michael Jelenic, Rob Hoegee, Scott Sonneborn, Amy Wolfram, Stan Berkowitz, Steven Melching, John Esposito, Keith Damron, Eddie Guzelian, Rob Hummel, Marty Isenberg, Joseph Kuhr, David Slack, Greg Weisman
🎼Música Kristopher Carter, Michael McCuistion, Lolita Ritmanis
🎬Productora Warner Bros. Animation
Género#SeriedeTV#Animación#Acción#Comedia#Superhéroes#Cómic#DCComics
Reparto / Intro / Sinopsis / Premios
⏱Duración 22min.
🖥Resolución 720x400
🗣Idioma Latino
Season 1 Episodio01 / 02 / 03 / 04 / 05 / 06 / 07 / 08 / 09 / 10 / 11 / 12 / 13
Season2
💥Muñeco Flash de DC Comics 30 CM
Lleva la velocidad a casa esta Navidad
✅OFERTA: 7.5€
❌ Antes: 15.99€
💰Ahorras un 53%🔥
Figura articulada coleccionable de alta calidad
👉 Hazte con él ahora y sorprende
#juguetes#coleccionables#superheroes#regalos#ninos#navidad#figuraflash#dccomics
🛰️Oferta publicada en Cultura y Ocio