Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
☕️ В России смягчили требования ГОСТа к растворимому кофе #HP
Росстандарт утвердил обновленные нормы для популярного бодрящего напитка. Новые правила вступят в силу в ноябре текущего года и внесут существенные изменения в критерии оценки качества растворимого кофе.
Согласно документу, теперь в порошкообразном продукте официально допускается наличие небольших комков. Для гранулированного кофе увеличено допустимое время растворения: при наличии спекшихся фрагментов напиток может готовиться до 2,5 минут, хотя ранее норма составляла всего 30 секунд.
Одним из самых резонансных изменений стала отмена фиксированного перечня ингредиентов для кофейного сырья. Теперь производители могут использовать различные пищевые компоненты в составе своей продукции без строгой привязки к прежним спискам.
А вы предпочитаете растворимый кофе или выбираете зерновой?
👍🏻 — Пью только свежесваренный!
⚡️ — Растворимый быстрее и удобнее.
❗Подписаться | Реклама |📲Наш канал в MAX
💸Hewlett-Packardвыиграла тендер на $2 млрд от Агентства национальной безопасности США для разработки систем видеонаблюдения с использованием искусственного интеллекта.
Контракт рассчитан на десять лет и предназначен для удовлетворения «растущих потребностей ведомства в управлении данными».
☝️ Новая система будет принимать и обрабатывать большие объемы информации, а также поддерживать возможности глубокого обучения и искусственного интеллекта.
#HP#отслеживание
#активности#HP
Фармим поинты от перспективного блокчейна, устойчивого к сибилам.
Humanity Protocol - блокчейн, устойчивый к атакам мультиаккеров, благодаря использованию Proof of Humanity (PoH).
Привлёк проект более $50м от Pantera Capital(lead), Jump Crypto(lead), Animoca, Shima, Hashed, Sandeep Naiwal, Mechanism, Blockchain.com, Foresight и др. На двух последних раундах оценка проекта была больше $1B.
Сейчас у проекта проходит тестнет, в котором мы можем собирать поинты RWT. Эти поинты команда обещает конвертировать в токены HP на листинге.
Что делать?
- переходим по ссылке, ждём в очереди и регистрируемся;
- придумываем Human ID и вводим реф. код ramadancrypton;
- заполняем личные данные и подтверждаем почту(лучше заполнять реальные данные, тк проект открыто борется с сибилами и ботами);
- подключаем все соц. сети(чем больше, тем лучше);
- ежедневно клеймим поинты RWT по кнопке "Daily check-in";
- берём тестовые tHP в кране и бриджим в сеть Sepolia и наоборот;
- приглашаем друзей;
- проявляем активность в дискорд и забираем там роли;
Так как сеть тестовая, бывают частые баги и ошибки, обновляйте страницу, ждите и пробуйте ещё раз.
Судя по слухам, проект может выйти уже в этом квартале, поэтому лучше не откладывать.