TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #146 · 16 сеп.

Функция sub в regex может принимать функцию в качестве аргумента repl. 📄 Из документации: If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string. То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений. Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений. Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере: Создаем карту замены. То есть какие строки на какие требуется менять. remap = { 'раз': '1', 'два': '2', 'три': '3', 'четыре': '4', 'пять': '5', } Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match. Используя данные этого объекта мы вычисляем замену on-the-fly! def get_str(match: re.Match): word = match.group(1) return remap.get(word.lower()) or word Пример текста. text = '''Раз Два Три Четыре Пять Вместе будем мы считать Пять Четыре Три Два Раз Мы считать научим вас ''' Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции. (Данный паттерн ищет отдельные слова в тексте) >>> print(re.sub(r'(\w+)', get_str, text)) 1 2 3 4 5 Вместе будем мы считать 5 4 3 2 1 Мы считать научим вас Думаю, достаточно наглядно 🤓 #libs#regex

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #tinybutmighty

当前筛选 #tinybutmighty清除筛选
AI & Law

@ai_and_law · Post #108 · 10.09.2023 г., 08:33

🌟 AI Sunday Wonders: Meet TinyLlama, the 550MB AI Model Trained on 3 Trillion Tokens Hello, everyone! In the world of AI, smaller models are gaining immense popularity due to their efficiency on edge devices with limited memory and processing power. Enter TinyLlama, a groundbreaking project led by a research assistant at Singapore University of Technology and Design. Despite its tiny 550MB size, TinyLlama is pre-trained on a massive three trillion tokens. This compact model holds great promise for various applications, including real-time machine translation without the need for an internet connection. The project aims to complete the training of this 1.1 billion Llama model in just 90 days, utilizing 16 A100-40G GPUs. You can track its progress and loss metrics in real-time. TinyLlama shares the same architecture and tokenizer as Meta's Llama 2, making it compatible with open-source projects built on Llama. TinyLlama joins the league of smaller language models like Pythia-1b and MPT-1b, offering developers efficient options for creating cutting-edge AI applications. #TinyLlama#AIModel#AIResearch#MachineLearning#AIInnovation#TinyButMighty