Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
🪐 On June 30, 1908, a small asteroid or comet exploded over Tunguska, Siberia, flattening 2,000 square kilometers of forest in an instant. Known as the Tunguska event, this airburst was caused by an object about 50–60 meters wide—large enough to release energy more powerful than the largest nuclear bomb ever detonated, yet leaving no impact crater. ✨
#asteroids⚡#danger⚡#Tunguska⚡#nasa⚡#galaxy⚡#stars⚡#astronomy⚡#universe⚡#cosmos⚡#space
👉subscribe Universe Mysteries
☄️ ¿Qué cayó del cielo en Tunguska? El misterio que aún intriga a la ciencia
Un día como hoy, el 30 de junio de 1908, el cielo sobre la remota taiga siberiana se iluminó con un destello cegador. A las 7:17 de la mañana, un objeto desconocido atravesó la atmósfera y explotó sobre el río Podkámennaya Tunguska, en la actual región de Krasnoyarsk, Rusia. La explosión fue tan potente que arrasó más de 2.150 km² de bosque, derribando cerca de 80 millones de árboles como si fueran palillos de fósforo.
Lo más desconcertante del llamado evento de Tunguska es que, a pesar de su fuerza (equivalente a entre 3 y 15 megatones de TNT, unas mil veces más potente que la bomba de Hiroshima), no dejó cráter. Hoy se sabe que el objeto, probablemente un asteroide de unos 50-60 metros de diámetro, explotó a unos 5-10 km de altura, liberando su energía en el aire.
La onda sísmica fue registrada por estaciones en toda Eurasia, y la onda de choque dio la vuelta al planeta dos veces. En Europa y Asia, las noches siguientes fueron muy brillantes, incluso en Londres y Estocolmo se reportaron cielos iluminados por nubes noctilucentes, formadas por partículas en suspensión tras la explosión.
Debido a la lejanía del lugar y a las dificultades logísticas, la primera expedición científica no llegó hasta 1927, liderada por el geólogo soviético Leonid Kulik. Su equipo encontró árboles calcinados y tumbados radialmente desde un epicentro invisible. No hallaron fragmentos del meteorito, lo que alimentó teorías de lo más variopintas: desde ovnis hasta armas secretas. Sin embargo, la ciencia moderna ha confirmado que se trató de un airburst, una explosión aérea causada por un cuerpo celeste.
¿Podría repetirse? Sí. De hecho, en 2013, un meteorito explotó sobre Cheliábinsk, también en Rusia, causando más de mil heridos por vidrios rotos.
#Tunguska#HistoriaRusa#MisteriosDelEspacio#Meteoritos#CienciaYCuriosidades
¡Comparte nuestro contenido!❤️
🖥https://vamosarusia.com
💬@vamosarusia