TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #146 · 16 сеп.

Функция sub в regex может принимать функцию в качестве аргумента repl. 📄 Из документации: If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string. То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений. Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений. Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере: Создаем карту замены. То есть какие строки на какие требуется менять. remap = { 'раз': '1', 'два': '2', 'три': '3', 'четыре': '4', 'пять': '5', } Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match. Используя данные этого объекта мы вычисляем замену on-the-fly! def get_str(match: re.Match): word = match.group(1) return remap.get(word.lower()) or word Пример текста. text = '''Раз Два Три Четыре Пять Вместе будем мы считать Пять Четыре Три Два Раз Мы считать научим вас ''' Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции. (Данный паттерн ищет отдельные слова в тексте) >>> print(re.sub(r'(\w+)', get_str, text)) 1 2 3 4 5 Вместе будем мы считать 5 4 3 2 1 Мы считать научим вас Думаю, достаточно наглядно 🤓 #libs#regex

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #copyrightdata

当前筛选 #copyrightdata清除筛选
AI & Law

@ai_and_law · Post #202 · 28.12.2023 г., 08:04

USA: New Bill Proposes Transparency Rules for AI Training Data Hello everybody! In US a new AI Foundation Model Transparency Act have been introduced. The aim is to ensure transparency in the usage of copyrighted data in training AI models. Companies developing foundation models must reveal the sources of their training data. This move is geared towards informing copyright holders if their data has been utilized. The bill tasks the Federal Trade Commission (FTC) to collaborate with the National Institute of Standards and Technology (NIST) in establishing rules for reporting training data transparency. Companies must disclose the origin of training data, how it's retained during inference, model limitations or risks, alignment with NIST’s AI Risk Management Framework, and adherence to federal standards. AI developers are required to report efforts to "red team" the model, especially in areas like medical queries, cybersecurity, elections, and services impacting vulnerable populations. This bill complements the Biden administration’s AI executive order, reinforcing the push for standardized reporting in AI models. The bill is yet to go through committee discussions, and its fate before the election campaign season remains uncertain. #AIlaw#CopyrightData#Legislation#TechNews#AIRegulation