TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 1 слични објави

Пребарај: #bm13

当前筛选 #bm13清除筛选

🚀 La Katyusha: el rugido soviético que cambió el curso de la guerra En plena víspera de la invasión nazi a la Unión Soviética, el 21 de junio de 1941, el Ejército Rojo incorporó oficialmente el lanzacohetes múltiple BM-13, un sistema revolucionario que pronto sería conocido por todos como Katyusha. Este artefacto, desarrollado en el Instituto de Investigación Científica NII-3 bajo la dirección de Gueorgui Kostikov, marcó un antes y un después en la historia de la artillería moderna. No era un arma cualquiera. Su capacidad para lanzar salvas masivas de cohetes sobre amplias zonas la convirtió en un instrumento de destrucción temido por los enemigos. Apenas ocho días después de su adopción, se formó en Moscú la primera batería experimental de artillería reactiva, comandada por el capitán Iván Flórov. El 14 de julio de 1941, esta unidad realizó su primer ataque en Orsha, Bielorrusia, contra un nudo ferroviario clave para el avance alemán. El resultado fue devastador: fuego ininterrumpido, pánico entre las tropas nazis y una pausa obligada en su ofensiva. Este éxito llevó al Alto Mando soviético a ordenar la creación de ocho regimientos de artillería reactiva equipados con los modelos BM-8 y BM-13. Se usó en los frentes más críticos, desde Stalingrado hasta Kursk, y su impacto psicológico era tan fuerte como su poder destructivo. Entre 1941 y 1944, la industria soviética produjo más de 10.000 unidades de Katyusha y más de 12 millones de cohetes, demostrando la capacidad de movilización del país en tiempos de guerra. El nombre “Katyusha” tiene un origen curioso y algo romántico. Algunos dicen que proviene de la canción popular compuesta por Matvéi Blanter y Mijaíl Isakovski, que hablaba de una joven esperando a su amado en el frente. Otros afirman que fue por la planta Komintern de Vorónezh, donde se fabricaron los primeros modelos, o incluso por un soldado que escribió el nombre de su novia en el lanzacohetes. Sea cual sea la verdad, el apodo se quedó grabado en la memoria colectiva como el arma de la victoria soviética. #Katyusha#HistoriaRusa#SegundaGuerraMundial#ArtilleríaSoviética#BM13 Apóyanos pulsando👉'BOOST'👈 🖥https://vamosarusia.com 💬@vamosarusia