Најди сличен содржај

Изворен канал @pythonotes · Post #146 · 16 сеп.

Функция sub в regex может принимать функцию в качестве аргумента repl. 📄 Из документации: If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string. То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений. Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений. Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере: Создаем карту замены. То есть какие строки на какие требуется менять. remap = { 'раз': '1', 'два': '2', 'три': '3', 'четыре': '4', 'пять': '5', } Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match. Используя данные этого объекта мы вычисляем замену on-the-fly! def get_str(match: re.Match): word = match.group(1) return remap.get(word.lower()) or word Пример текста. text = '''Раз Два Три Четыре Пять Вместе будем мы считать Пять Четыре Три Два Раз Мы считать научим вас ''' Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции. (Данный паттерн ищет отдельные слова в тексте) >>> print(re.sub(r'(\w+)', get_str, text)) 1 2 3 4 5 Вместе будем мы считать 5 4 3 2 1 Мы считать научим вас Думаю, достаточно наглядно 🤓 #libs#regex

Hashtags

#libs #regex

Резултати

Пронајдени 4 слични објави

Пребарај: #vl

当前筛选 #vl清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #9453 · 30.01.2026 г., 10:05

Најди слично Погледај

🌟PaddleOCR-VL-1.5: компактная модель для сложного парсинга. PaddlePaddle обновили свою линейку PaddleOCR-VL, выпустив PaddleOCR-VL-1.5 - компактную VLM на 0.9 млрд. параметров на базе ERNIE-4.5-0.3B-Paddle. Несмотря на скромный размер, в задачах разбора документов она показывает SOTA-результаты. На тесте OmniDocBench v1.5 модель выбила 94.5% точности, обойдя не только прошлую версию, но и более тяжелых конкурентов. Фишка обновления - упор на полевые условия. Модель специально учили работать с плохими исходниками: кривыми сканами, бликами от мониторов и мятыми страницами. Попутно сделали бенчмарк Real5-OmniDocBench, который гоняет модели по 5 сценариям: сканирование, перекосы, деформация листа, фото с экрана и плохое освещение. 🟡В 1.5 добавили: 🟢Text spotting: находит и распознает текст одновременно (печатный русский - неплохо, рукописный - почти никак) 🟢Seal recognition: распознает печати (русские - не очень, китайские - на ура). 🟢Cross-page table merging: умеет склеивать таблицы, которые разорваны между страницами. 🟢Работа с заголовками: не теряет структуру параграфа при переходе на новый лист. 🟢Новые языки: добавили поддержку тибетского и бенгальского, подтянули распознавание редких символов и древних текстов. 🟡Деплой - на любой вкус Модель работает с transformers, дружит с Flash Attention 2 и, само собой, поддерживается PaddlePaddle 3.2.1. Если нужно быстро поднять сервис - есть готовый Docker-образ. 🟡Пара важных моментов по использованию Если нужен полноценный постраничный парсинг всего документа, лучше использовать официальный пакет PaddleOCR. Реализация через transformers пока ограничена только распознаванием отдельных элементов и споттингом. В пайплайн встроили логику препроцессинга. Если картинка меньше 1500 пикселей, она автоматом апскейлится фильтром Lanczos. При этом есть потолок в 1.6 млн. пикселей для споттинга, это чтобы не перегружать память GPU и сохранить читаемость мелкого шрифта. 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Arxiv 🟡Demo 🟡DeepWiki 🖥Github @ai_machinelearning_big_data #AI#ML#VL#OCR#PaddleOCR

Hashtags

#ai #ml #vl #ocr #paddleocr

cosplayupload

@cosplayuploadtest2 · Post #102370 · 23.03.2025 г., 03:16

Најди слично Погледај

Title: Aoi_Fujino_藤乃あおい,_AsaGei_アサ芸Secret!_Vl.91 Authors: #None Tags: #None#Aoi_Fujino_藤乃あおい#アサ芸Secret！ #Aoi#Fujino#藤乃あおい#AsaGei#アサ芸Secret! #Vl #91 recommendation: None TelegraphLinks:page-0-10

Hashtags

#none #aoi_fujino_藤乃あおい #アサ芸secret #aoi #fujino #藤乃あおい #asagei #vl

cosplayupload

@cosplayuploadtest2 · Post #102334 · 23.03.2025 г., 03:14

Најди слично Погледај

Title: Fuka_Hanasaki_花咲楓香,_AsaGei_アサ芸Secret!_Vl.91 Authors: #None Tags: #None#Fuka_Hanasaki_花咲楓香#アサ芸Secret！ #Fuka#Hanasaki#花咲楓香#AsaGei#アサ芸Secret! #Vl #91 recommendation: None TelegraphLinks:page-0-23

Hashtags

#none #fuka_hanasaki_花咲楓香 #アサ芸secret #fuka #hanasaki #花咲楓香 #asagei #vl

cosplayupload

@cosplayuploadtest2 · Post #102335 · 23.03.2025 г., 03:14

Најди слично Погледај

Title: Ayano_Sumida_澄田綾乃,_AsaGei_アサ芸Secret!_Vl.91 Authors: #None Tags: #None#Ayano_Sumida_澄田綾乃#アサ芸Secret！ #Ayano#Sumida#澄田綾乃#AsaGei#アサ芸Secret! #Vl #91 recommendation: None TelegraphLinks:page-0-11

Hashtags

#none #ayano_sumida_澄田綾乃 #アサ芸secret #ayano #sumida #澄田綾乃 #asagei #vl