Небольшой трик с регулярными выражениями который редко вижу в чужом коде.
Допустим, вам нужно распарсить простой текст и вытащить оттуда пары имя+телефон. Вернуть всё это надо в виде списка словарей. Возьмем очень простой пример текста.
>>> text = '''
>>> Alex:8999123456
>>> Mike:+799987654
>>> Oleg:+344456789
>>> '''
Соответственно, для выделения нужных элементов будем использовать группы. Получится такой паттерн:
(\w+):([\d+]+)
Как мы будем формировать словарь из найденных групп?
>>> import re
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append({
>>> "name": match.group(1),
>>> "phone": match.group(2)
>>> })
>>> print(results)
[{'name': 'Alex', 'phone': '8999123456'}, ...]
Можно немного сократить запись используя zip
>>> results = []
>>> for match in re.finditer(r"(\w+):([\d+]+)", text):
>>> results.append(dict(zip(['name', 'phone'], match.groups())))
Но есть способ лучше! Это именованные группы в regex. Можно в паттерне указать имя группы и результат сразу забрать в виде словаря.
>>> for match in re.finditer(r"(?P<name>\w+):(?P<phone>[\d+]+)", text):
>>> results.append(match.groupdict())
То есть всё что я сделал, это добавил в начале группы (внутри сбокочек) такую запись:
(?P<group-name>...)
Теперь найденная группа имеет имя и можно обратиться к ней как к элементу списка
>>> name = match['name']
Либо забрать сразу весь словарь методом groupdict()
>>> match.groupdict()
#tricks#regex
🎉DeepSeek R1: год спустя
Ровно год назад дебютировала DeepSeek-R1, сделавшая ставку на глубокие рассуждения (reasoning). За это время она заняла прочную нишу в математике, программировании и точных науках, предлагая высокую эффективность и точность.
💎Чем DeepSeek выгоден читателю канала?
➡️Эксперт в логике: Сильнее многих в решении сложных задач, требующих последовательных рассуждений.
➡️Эффективен: Использует не все параметры на запрос, что часто делает ответ быстрее и экономичнее.
➡️Открыт: Модель с открытым исходным кодом.
➡️Бесплатен! Да, это до сих пор странно и приятно, с учётом дикой зависимости всех производителей от огромного парка железа, потребляющего электроэнергию.
🔍Намёк на новое?
Недавно DeepSeek обновили исходную статью о R1: она «выросла» с 22 до 86 страниц. Обновление вышло ровно через год после релиза модели. Это совпадение или тихая подготовка к анонсу R2 (которую ждали в мае, а потом в августе 2025) или другой новинки в этом январе? Ждём.
#DeepSeek#R1#R2#ИИ#AI#LLM
https://t.me/semasci
Found a random cipher puzzle on a YouTube video. It was easy enough that I can figure out how to solve it in a few seconds, but I was lazy to do the math, so I threw it to the “thinking” #LLM s.
Surprisingly, despite how easy it looks, only #ChatGPT#o1 managed to solve it correctly. #DeepSeek#R1 and #Gemini 2.0 Flash Thinking Experimental 01-21 has confused themselves, and reached wrong conclusions.
Prompt:
Please solve the puzzle
The code to decode is:
0820201619://2515212021.0205/42151797290590-224531
The hints provided are:
car: 030118
Apple: 2716161205
1-1: 91-91
Response from GPT o1: https://chatgpt.com/share/67971451-2ee0-8013-9d80-9899543614ae
Response from DeepSeek and Gemini: https://gist.github.com/blueset/828cbc3de9efa9af44a1379dc26e2785
🐟