Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Warhammer 40000: Dawn Of War (2004).
Этой культовой компьютерной игре уже 21 год, а она всё так же эпична.
Как и её вступительный ролик)
#Нейросуть#Neuralsense#MalikovAI#Видеоигры
https://rutube.ru/video/5a90da44eded2942ac4be3819c34eb3d/
Minimax очень забавно дорисовывает объекты, которых нет на изначальной картинке)
Решил приодеть девочку из моей версии проекта SPARTAN.
#ИИ#AI#AIVideo#MalikovAI#Neuralsense#Нейросуть#ИскусственныйИнтеллект
В начале января вернулся к тому, с чего начинал свой путь в нейронках — большой проект с музыкой моего отца.
В этот раз сделал видеоряд для композиции «Snowflake».
Однажды приходит время, когда ведьма должна передать свой дар. Зимняя ведьма не была исключением)
Возможно, будет продолжение.
#ИИ#AI#AIVideo#MalikovAI#Neuralsense#Нейросуть#ИскусственныйИнтеллект
Генетически усовершенствованный солдат общается с очаровательной ИИ-помощницей.
Научно-фантастический игровой боевик Halo: Infinite.
Фантастика, то есть. Вымысел. Пока что :D
#ИИ#AI#AIVideo#MalikovAI#Neuralsense#Нейросуть#ИскусственныйИнтеллект
Президент на букву Т совместно с крупными компаниями (одна из которых OpenAI, создатель ChatGPT) планируют вложить более 500 млрд. долларов в создание инфраструктуры искусственного интеллекта в США.
И разумеется, всё на благо человечества. Экономическая выгода, рабочие места. Будем посмотреть)
Масштабы впечатляют, а вот название не очень удачное, по-моему. Отсылочка сразу к нескольким фильмам и все они не очень позитивные :D
#ИИ#AI#AIVideo#MalikovAI#Neuralsense#Нейросуть#ИскусственныйИнтеллект
Попробовал парочку промптов в новой видео модели Luma - Ray2.
Пока что это text to video.
Если однажды появится функция загрузки изображений и она будет работать так же - это будет просто отлично)
Я теперь качество нейронок буду оценивать тем, как они анимируют змей.
#ИИ#AI#AIVideo#MalikovAI#Neuralsense#Нейросуть#ИскусственныйИнтеллект
Что же, год подходит к своему завершению.
Он был очень насыщенным и захватывающим, полным развития и очень крутых знакомств!
Итоги я ещё подведу, а сейчас пора замедляться и настраиваться на небольшой отдых.
Чтобы набраться сил и ворваться в новый эпизод с ещё большим рвением!
Поздравляю всех с Наступающим Новым годом!
В конце года меня хватило на небольшой ролик не для работы.
Надеюсь, вам понравится.
#ИИ#AI#AIVideo#MalikovAI#Neuralsense#Нейросуть#ИскусственныйИнтеллект
Если осень - пора ужастиков, то зимой я очень люблю перечитывать комиксы и пересматривать мульты/фильмы по вселенной Бэтмена.
#ИИ#AI#AIVideo#MalikovAI#Neuralsense#Нейросуть#ИскусственныйИнтеллект