TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #146 · 16 сеп.

Функция sub в regex может принимать функцию в качестве аргумента repl. 📄 Из документации: If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string. То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений. Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений. Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере: Создаем карту замены. То есть какие строки на какие требуется менять. remap = { 'раз': '1', 'два': '2', 'три': '3', 'четыре': '4', 'пять': '5', } Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match. Используя данные этого объекта мы вычисляем замену on-the-fly! def get_str(match: re.Match): word = match.group(1) return remap.get(word.lower()) or word Пример текста. text = '''Раз Два Три Четыре Пять Вместе будем мы считать Пять Четыре Три Два Раз Мы считать научим вас ''' Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции. (Данный паттерн ищет отдельные слова в тексте) >>> print(re.sub(r'(\w+)', get_str, text)) 1 2 3 4 5 Вместе будем мы считать 5 4 3 2 1 Мы считать научим вас Думаю, достаточно наглядно 🤓 #libs#regex

Hashtags

Резултати

Пронајдени 2 слични објави

Пребарај: #latinime

当前筛选 #latinime清除筛选

🇷🇺ИНТЕГРАЦИЯ НАШИХ ЯЗЫКОВ В ANDROID: РАСЧЕТ МАСШТАБА Включение Тувинской клавиатуры в AOSP (Android Open Source Project) демонстрирует возможность расширения языковой поддержки Android. Сейчас, когда Тувинская раскладка находится на этапе финального утверждения, необходимо оценить, какой ресурс потребуется для дальнейшего масштабирования — например, для 120 языков, использующих схожий принцип кириллической основы. * Оценка Ресурсов (в Байтах и Строках) Базируясь на фактическом объеме данных Тувинской клавиатуры (36 букв) и с учетом запаса на более сложные алфавиты, мы принимаем средний показатель в 25 КБ на один язык. При масштабировании на 120 языков, это дает следующие результаты: | Показатель | Объем на 1 Язык | Общий Объем для 120 Языков | | Объем данных (для AOSP) | 25 КБ | 3.0 Мегабайта | | Объем кода (добавленные строки) | ≈ 324 строки | ≈ 39 000 строк | | Количество файлов (XML-раскладки) | ≈ 6 файлов | ≈ 720 файлов | Вывод: Общий объем данных составляет всего 3 МБ! С технической точки зрения, такой размер не представляет проблемы для кодовой базы Android. Основная сложность заключается в лингвистической и логистической работе. * Ключевые Аспекты Работы с AOSP Вклад такого масштаба требует строгого подхода к организации процесса: 1. Проектирование Раскладок: Необходимо обеспечить унифицированное и эргономичное размещение уникальных символов (например, их расположение на менее используемых Русских клавишах, как это было сделано для Тувинского языка) для всех 120 алфавитов. 2. Проверка Качества (QA): Каждый из 720 файлов требует проверки на соответствие стандартам кодирования и корректность ввода символов. Этот процесс критически важен для принятия кода. 3. Стратегия Code Review: Для ускорения процесса интеграции через Gerrit, проект необходимо разделить на 20-30 управляемых Pull Request-ов. Это позволит ревьюерам AOSP проводить проверку поэтапно и снизит время ожидания. Резюме: Задача по интеграции 120 языков требует значительной организационной и лингвистической работы, но является технически реализуемой. Этот вклад напрямую обеспечивает доступность родного языка для миллионов пользователей Android. #AOSP#Android#ЯзыковаяПоддержка#LatinIME#OpenSource#Разработка

Раскладка Тувинского языка добавлена в AOSP (Android Open Source Project) Рад сообщить о важном этапе в развитии поддержки языков в Android: Патч, добавляющий раскладку Тувинского языка (Tuvan) в компонент системной клавиатуры LatinIME, был официально объединен (merged) во внутреннюю кодовую базу Android Open Source Project (AOSP). Теперь буду по вашим клавиатурам делать то же самое. Давайте сделаем это совместно – присылайте свои клавиатуры! Изменение получило все необходимые технические (Code-Review) и лицензионные (Open-Source-Licensing) подтверждения от инженеров, курирующих AOSP. Изменение внутренне слито (merged) и готовится к релизу. Что это значит для пользователей: Носители Тувинского языка вскоре получат корректную и удобную раскладку клавиатуры, интегрированную в стандартные средства ввода Android. Даты релиза: Точные сроки выпуска публичного обновления зависят от цикла релиза Android и поставщиков устройств, но, как правило, объединенные изменения появляются в ближайших крупных или ежеквартальных системных обновлениях AOSP. P.S.: В ближайшее время планируется отправка других вариантов Тувинской клавиатуры, чтобы обеспечить максимально разнообразное и удобное использование языка на устройствах Android. #AOSP#Android#LatinIME#ТувинскийЯзык#Tuvan#OpenSource#Разработка