Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
Еще про ИИ и когнитивные искажения
Всю ночь смотрела интервью Дурова перечитывала статьи про использование ИИ в науке, готовясь к упомянутой выше дискуссии и к докладам на двух конференциях.
В частности, обратилась к статье «Artificial intelligence and illusions of understanding in scientific research», вышедшей в марте в журнале Nature.
Авторы статьи, как водится, отмечают, что распространение ИИ-инструментов в науке рано или поздно приведет к тому, что мы будем производить больше знания (в том числе и «мусорного»), но при этом меньше понимать его источники и содержание.
Ученые делят применяемые сегодня исследовательские ИИ-инструменты на генеративные и предиктивные и на основе этого выводят 4 условных типа ИИ в современнойнауке:
▪️Оракул (генерация научных гипотез и study design)
▪️Суррогат (моделирование сложных системных процессов и сбор данных)
▪️Квант (анализ данных для исследования)
▪️Арбитр (рецензирование полученных результатов исследования)
Их совместное применение увеличивает некоторые эпистемические риски, связанные с подверженностью ученых «иллюзиям понимания» (в т.ч. иллюзиям объяснительной глубины, широты и объективности).
Таким образом, самый актуальный вопрос сегодняшнего дня не «Что даст ИИ науке?» а «Как у нас формируются когнитивные иллюзии нового типа, порождаемые использованием ИИ?».
Старые-добрые ловушки вроде «эффекта ореола», «эффекта фрейминга» и, конечно, «эффекта Элизы» уже давно изучены, а вот новые - пока не очень.
Пока новые исследования по этой теме пишутся, вот тут можно посмотреть легендарныйфайл с 176 когнитивными искажениями, с которыми мы сталкиваемся ежедневно. Скорее всего, применение ИИ просто усугубит многие из них.
#papers
Ученые из Института химии растворов им. Г.А. Крестова РАН методом твердофазного синтеза с механохимической активацией получили фотокатализатор, содержащий гетероструктуры Fe2TiO5. Они изучили механизмы образования кристаллических фаз, а также эволюцию структурных и физико-химических свойств полученных материалов при отжиге на воздухе и в азоте. На основании исследований фотокаталитической активности нанокатализаторов при разложении органического красителя родамина Б учеными был предложен механизм разделения зарядов в исследуемых керамических нанокомпозиционных материалах, связанный с различным поглощением фотонов и образованием электронно-дырочных пар.
Подробнее об исследовании см.: https://www.sciencedirect.com/science/article/pii/S0254058423002018?via%3Dihub
Ivanov K.V., Noskov A.V., Alekseeva O.V., Agafonov A.V. Effect of annealing conditions on the physicochemical and photocatalytic properties of a nanopowder based on Fe2TiO5. Materials Chemistry and Physics. 2023, Vol. 299, 127493.
https://doi.org/10.1016/j.matchemphys.2023.127493
#ИХРРАН#papers
#LLMs#papers
Tree of Thoughts: Deliberate Problem Solving with Large Language Models
Language models are increasingly being deployed for general problem solving across a wide range of tasks, but are still confined to token-level, left-to-right decision-making processes during inference. This means they can fall short in tasks that require exploration, strategic lookahead, or where initial decisions play a pivotal role.
✍ Princeton and Google DeepMind
-----
Main channel: @repo_science
Coupons: @freecoupons_reposcience
-----
Ученые ИХР РАН предложили способы идентификации энантиомеров противогрибковых препаратов класса 1,2,4-триазолов, которые можно будет применить для разработки лекарств.
Уникальность энантиомеров заключается в том, что они представляют собой зеркальные отражения друг друга и имеют близкие физические свойства, однако биологическая активность «правого» и «левого» энантиомеров не всегда одинакова. Например, один энантиомер в составе лекарства может оказывать терапевтическое действие, а другой - быть «пустышкой» или вызывать неблагоприятные побочные эффекты. Ключевая проблема фармацевтики состоит в том, чтобы определить, какой энантиомер или их смесь содержится в лекарстве.
Подробнее о способах решения этой задачи, предложенных в ИХР РАН, читайте на сайте: http://www.isc-ras.ru/ru/novosti/levyy-ili-pravyy, а также на портале "Научная Россия": https://scientificrussia.ru/articles/ucenye-vyasnili-kak-razdelat-pravye-i-levye-enantiomery-i-bezopasno-ispolzovat-ih-kak-osnovu-dla-lekarstv
#ISCRAS#papers#Media