TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #146 · 16 сеп.

Функция sub в regex может принимать функцию в качестве аргумента repl. 📄 Из документации: If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string. То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений. Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений. Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере: Создаем карту замены. То есть какие строки на какие требуется менять. remap = { 'раз': '1', 'два': '2', 'три': '3', 'четыре': '4', 'пять': '5', } Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match. Используя данные этого объекта мы вычисляем замену on-the-fly! def get_str(match: re.Match): word = match.group(1) return remap.get(word.lower()) or word Пример текста. text = '''Раз Два Три Четыре Пять Вместе будем мы считать Пять Четыре Три Два Раз Мы считать научим вас ''' Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции. (Данный паттерн ищет отдельные слова в тексте) >>> print(re.sub(r'(\w+)', get_str, text)) 1 2 3 4 5 Вместе будем мы считать 5 4 3 2 1 Мы считать научим вас Думаю, достаточно наглядно 🤓 #libs#regex

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #textanalysis

当前筛选 #textanalysis清除筛选
Data Science Jobs

@datasciencejobs · Post #2363 · 11.10.2024 г., 09:00

#NLP#ML#AI#NaturalLanguageProcessing#DeepLearning#Python#УдаленнаяРабота#ИП#LLM#TextAnalysis Вакансия: ML/NLP разработчик Грейд: Middle+/Senior Локация: строго РФ Формат работы: удалённая, трудоустройство только по ИП Зарплата: 250-350 тыс. руб. 💸 📌О проекте: Мы разрабатываем интеллектуальную Систему анализа проектной документации для обработки и анализа текстовых данных. В рамках проекта вы будете участвовать в создании когнитивного поиска, рекомендательных систем и digital-ассистентов, помогая реализовать передовые решения на основе естественного языка. 📌Задачи: - Разработка моделей для структурирования текстов и понимания запросов на естественном языке 🧠 - Решение NLP задач для когнитивного поиска и рекомендательных систем - Разработка NLU моделей для digital-ассистентов - Развитие и оптимизация больших языковых моделей (LLM) 📌Мы предлагаем: - Удалённую работу с гибким графиком 🏡 - Трудоустройство по ИП с прозрачными условиями - Участие в интересных проектах по текстовому анализу - Возможности для профессионального роста 🚀 - Работа с передовыми технологиями и решениями 📌Наши ожидания: - Опыт работы с NLP задачами от 3 лет - Глубокие знания машинного обучения и deep learning в NLP - Практический опыт работы с задачами для русского языка: классификация текста, topic modeling, NER, Text2SQL - Участие в хакатонах или Kaggle будет плюсом 🏆 📌Технологический стек: Python, NLTK, DeepPavlov, Hugging Face, LSH, faiss, nmslib, HNSW, Spark, Pandas, Numpy, Sklearn, Keras, PyTorch, Tensorflow, RNN, CNN, Transformer, BERT. 📌Преимуществом будет: - Опыт работы с LLM, включая RAG, LangChain, LoRA - Навыки fine-tuning и prompt engineering Если хотите присоединиться к нашему проекту, пишите в Telegram: @BekhterevaElena.