Функция sub в regex может принимать функцию в качестве аргумента repl.
📄 Из документации:
If repl is a function, it is called for every non-overlapping occurrence of pattern. The function takes a single match object argument, and returns the replacement string.
То есть для каждого совпадения будет вызвана функция для вычисления замены вместо замены на одну и ту же строку для всех совпадений.
Иными словами, для замены разных совпадений на разные строки не потребуется запускать re.sub() много раз для каждой строки замены. Достаточно определить функцию, которая вернёт строку для каждого из совпадений.
Описание слишком запутанное🤔, давайте лучше рассмотрим на простом примере:
Создаем карту замены. То есть какие строки на какие требуется менять.
remap = {
'раз': '1',
'два': '2',
'три': '3',
'четыре': '4',
'пять': '5',
}
Пишем функцию поиска строки для замены. Единственным аргументом будет объект re.Match.
Используя данные этого объекта мы вычисляем замену on-the-fly!
def get_str(match: re.Match):
word = match.group(1)
return remap.get(word.lower()) or word
Пример текста.
text = '''Раз Два Три Четыре Пять
Вместе будем мы считать
Пять Четыре Три Два Раз
Мы считать научим вас
'''
Теперь запускаем re.sub и вместо строки замены (repl) подаём имя функции.
(Данный паттерн ищет отдельные слова в тексте)
>>> print(re.sub(r'(\w+)', get_str, text))
1 2 3 4 5
Вместе будем мы считать
5 4 3 2 1
Мы считать научим вас
Думаю, достаточно наглядно 🤓
#libs#regex
Parsing.uz — bu Oʻzbek tilida ishlovchi onlayn xizmat bo‘lib, lotin alifbosidagi matnni kirill alifbosiga va aksincha o‘girishga moʻljallangan.
Quyidagi asosiy funksiyalari bor:
➖ Word, Excel, PowerPoint, PDF, TXT va OpenDocument (odt, ods) formatdagi hujjatlarni lotindan kirillga yoki kirilldan lotinga konvertatsiya qilish.
➖ «Ў», «Қ», «Ҳ», «Ғ», «Ч», «Ц» kabi o‘zbek alifbosidagi harflarni noto‘g‘ri tarjima qiladigan ba’zi dasturlardagi muammolarni tuzatish.
Afzalliklari:
➖Matnni avtomatik va tez oʻgirish imkoniyati.
➖ Hujjatlar bilan ishlaganda qulay — turli fayl formatlarini qoʻllab-quvvatlaydi.
➖ Oʻzbek tiliga xos harflar bilan ishlashda aniqlik
✅Bizning barcha loyihalar | #parsing
🍯 Как узнать, что токен — honeypot?
🚩Красный флаг — Что это значит
🤖 Нет исходного кода контракта на explorer'е — Скрывают детали схемы
📉 Нельзя увидеть, кто продавал токен — Только покупки, значит ловушка
🔐 Контракт не верифицирован — Может быть встроен запрет на продажу
💸 Высокие комиссии (от 30% и выше) — Крипто-вампиризм
🧠 Слишком активный памп без причины — Это не инсайд, это развод
Также можно использовать honeypot checker'ы, например: https://honeypot.is, https://tokensniffer.com
Итог:
Honeypot в крипте — это когда тебе дают “попробовать” токен, но забирают всё остальное.
Ты не трейдер. Ты наживка.
Купить можно — выйти нельзя.
#PARSING
💰"NFT-дроп как метод самообнуления"
Фейковые дропы, NFT и TON-розыгрыши в Телеге — всё ещё рабочий скам, только обёртка стала красивее.
Хочешь понять, как именно у тебя сливают кошелёк за 3 клика — листай слайды.
Если ты до сих пор веришь в подарки от Telegram — читай дважды.
#PARSING
🤡«Меня не развести, я в интернете с 2012-го, я шарю»
— сказал чел и через 3 минуты назвал код из СМС «сотруднику банка».
Почему мы так уверены, что не попадёмся?
Потому что мозг делает тупейшую вещь — он думает, что уже всё знает.
Разберем по пунктам:
1. Иллюзия иммунитета
- Ты слышал тысячи историй, видел мемы, читал в тгк/вк, как “лохов разводят на деньги”.
- И думаешь: «Это с ними. Я-то гений. Я-то шарю».
- Поздравляем, ты в зоне риска.
2. “Это слишком глупо, чтобы сработать”
- Звонит бот: «Ваш договор просрочен, переведите деньги на безопасный счёт».
- Ты рофлишь… а потом через 3 звонка — реальный голос, знание твоих данных, угроза суда.
- И ты уже не ржёшь. Ты паникуешь.
3. Эффект доверия
- Как только слышим «банк», «налоговая», «Минцифра» — 🧎♂️ автоматически подчиняемся.
- Это инстинкт. Нам проще поверить, чем спорить.
- А скамеры — этим и живут.
4. Психология паники
- «На вас оформлен кредит, сейчас деньги спишутся!»
- Таймер, давление, угроза.
Мозг — в режиме “бей или беги”.
Ты бьёшь... по кнопке перевода.
Вывод:
Если ты думаешь, что “ не лох/гений/нетакуся ” — ты не защищён, а уязвим - как посылка из Shein на таможне📦.
Реально защищён — только тот, кто осознан и готов к разводу. Кто знает схемы. Кто не доверяет звонкам. Кто дважды проверяет.
Не будь уверенным. Будь внимательным!
#PARSING
Ребятки, подготовил для вас краткую навигацию по каналу, чтобы ничего не затерялось.
Интересные для себя темы ищем по хештегам ниже:
#NEWS - новые, как твои кроссики👟, новости о недо-мошенниках
#SCAM - свежайшие, как спелый персик🍑, схемы (лучше перебдеть, чем недобдеть)
#HOT - горячие, как бабушкины блинчики🥞, новости о том, что запрещают или запретят в скором времени
#TOP - собрали хит-парад способов стать бомжом🏚, даже не выходя из дома.
#PARSING - разбираем, почему при слове “уголовная ответственность” ты сливаешь бабки быстрее, чем суши по акции🍣.
#python#agents#generative_ai_tools#llamacpp#llm#onnx#openvino#parsing#retrieval_augmented_generation#small_specialized_models
llmware is a powerful, easy-to-use platform that helps you build AI applications using small, specialized language models designed for business tasks like question-answering, summarization, and data extraction. It supports private, secure deployment on your own machines without needing expensive GPUs, making it cost-effective and safe for enterprise use. You can organize and search your documents, run smart queries, and combine knowledge with AI to get accurate answers quickly. It also offers many ready-to-use models and examples, plus tools for building chatbots and agents that automate complex workflows. This helps you save time, improve accuracy, and securely leverage AI for your business needs[1][3][5].
https://github.com/llmware-ai/llmware