TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #ast

当前筛选 #ast清除筛选
Crypto Profit Coach™

@cryptoprofitcoach · Post #9012 · 05.05.2024 г., 17:13

#AST👈 https://www.binance.com/en/trade/AST_BTC Buying Range 220- 230 👆 Buy in parts 👈strictly follow for max profits Sell 🤑 240-250 🤑 250-270 🤑 270-290 🚀 290-320 & above Bullish above 200🔼 Dead Zone below 200🔽

Hashtags

Machinelearning

@ai_machinelearning_big_data · Post #8296 · 18.08.2025 г., 11:11

🎙️NVIDIA выпустили Canary-1B v2 — открытую модель для распознавания и перевода речи, которая работает с 25 европейскими языками. Что она умеет: - 📝 Точное ASR (распознавание речи) и AST (перевод речи) между английским и 24 другими языками. - Автоматическая пунктуация, капитализация и точные таймстампы до слова. - Поддержка русского, французского, немецкого, испанского и многих других языков. Чем интересна - До 10× быстрее инференс, чем у моделей в 3 раза больше. - Уже показывает state-of-the-art точность среди открытых моделей на Hugging Face. - Лицензия CC-BY-4.0 — можно свободно использовать в проектах. Под капотом: - Архитектура: FastConformer-энкодер + Transformer-декодер (~978M параметров). - Форматы: .wav и .flac, моно 16 кГц. - Легко интегрируется через NVIDIA NeMo или прямо с Hugging Face. Где пригодится: 🟢 голосовые ассистенты 🟢 субтитры и перевод видео 🟢 чат-боты с речевым вводом 🟢 real-time анализ речи Всего ~978M параметров → легче, быстрее и дешевле в использовании, чем большие модели конкурентов. 🟠Попробовать можно здесь: https://huggingface.co/nvidia/canary-1b-v2 🟠SET: https://huggingface.co/datasets/nvidia/Granary 🟠PARAKEET: https://huggingface.co/nvidia/parakeet-tdt-0.6b-v3 @ai_machinelearning_big_data #AI#NVIDIA#SpeechRecognition#ASR#AST#Multilingual#MachineLearning#DeepLearning

Coinlegs Cryptocurrency Signals

@coinlegs · Post #9743 · 17.01.2024 г., 14:01

🐬DOLPHIN | AI PREDICTIONS 17.01.2024 14:00 GMT Expected 5% Profit/Loss in 24 Hours #BOND | 3.493 | PP: 1% | LP: 100% #CVX | 3.002 | PP: 0% | LP: 90% #POND | 0.01511 | PP: 0% | LP: 90% #KMD | 0.2581 | PP: 0% | LP: 91% #ETC | 26.36 | PP: 0% | LP: 92% #JOE | 0.5105 | PP: 0% | LP: 93% #PROS | 0.4579 | PP: 0% | LP: 93% #VGX | 0.1258 | PP: 0% | LP: 93% #ATA | 0.0949 | PP: 0% | LP: 94% #BETA | 0.07108 | PP: 0% | LP: 94% #DEGO | 2.261 | PP: 0% | LP: 94% #AST | 0.124 | PP: 0% | LP: 95% #AVAX | 35.97 | PP: 0% | LP: 95% #CELR | 0.01949 | PP: 0% | LP: 95% #WAXP | 0.0619 | PP: 0% | LP: 95% #AXS | 8.05 | PP: 0% | LP: 96% #BEL | 0.6378 | PP: 0% | LP: 96% #GTC | 1.231 | PP: 0% | LP: 96% #UMA | 2.004 | PP: 0% | LP: 96% #WBTC | 42686.15 | PP: 0% | LP: 96% #BTC | 42609.84 | PP: 0% | LP: 97% #GRT | 0.1666 | PP: 0% | LP: 97% #MATIC | 0.8322 | PP: 0% | LP: 97% #PEPE | 0.00000121 | PP: 0% | LP: 97% #UTK | 0.0731 | PP: 0% | LP: 97% #MOB | 0.354 | PP: 0% | LP: 98% #OCEAN | 0.4489 | PP: 0% | LP: 98% #AAVE | 101.35 | PP: 0% | LP: 99% #ATOM | 10.097 | PP: 0% | LP: 99% #BSW | 0.0941 | PP: 0% | LP: 99% #BTTC | 0.00000104 | PP: 0% | LP: 99% #DGB | 0.00839 | PP: 0% | LP: 99% #FLM | 0.084 | PP: 0% | LP: 99% #FOR | 0.02193 | PP: 0% | LP: 99% #LOOM | 0.09158 | PP: 0% | LP: 99% #LTO | 0.0814 | PP: 0% | LP: 99% #MBOX | 0.3093 | PP: 0% | LP: 99% #PUNDIX | 0.4558 | PP: 0% | LP: 99% #QTUM | 3.113 | PP: 0% | LP: 99% #RPL | 34.09 | PP: 0% | LP: 99% #SCRT | 0.4198 | PP: 0% | LP: 99% #STX | 1.5891 | PP: 0% | LP: 99% #ACA | 0.1001 | PP: 0% | LP: 100% #ADA | 0.5293 | PP: 0% | LP: 100% #ADX | 0.1875 | PP: 0% | LP: 100% #AKRO | 0.00532 | PP: 0% | LP: 100% #ALCX | 25.88 | PP: 0% | LP: 100% #ALPHA | 0.1075 | PP: 0% | LP: 100% #AMP | 0.003404 | PP: 0% | LP: 100% #ARDR | 0.0916 | PP: 0% | LP: 100% #BADGER | 3.471 | PP: 0% | LP: 100% ... ——————————————————————— Total Predictions: 367 PP > 50%: 2 LP > 50%: 163 PP > 60%: 0 LP > 60%: 157 PP > 70%: 0 LP > 70%: 147 PP > 80%: 0 LP > 80%: 140 PP > 90%: 0 LP > 90%: 130 ——————————————————————— PP: Profit Probability | LP: Loss Probability