TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #musicindustry

当前筛选 #musicindustry清除筛选
AI & Law

@ai_and_law · Post #740 · 12.01.2026 г., 08:04

🇺🇸🎼Universal Music Group and NVIDIA Partner on AI Music Discovery Universal Music Group (UMG) announced a collaboration with NVIDIA to develop AI tools for music discovery, creation, and engagement, using NVIDIA’s AI infrastructure and UMG’s music catalog. The partnership focuses on joint R&D aimed at advancing human music creation, ensuring rightsholder compensation, and improving attribution and protection of music-based content. As part of the project, the companies will extend NVIDIA’s Music Flamingo model to process full-length tracks, capturing elements such as harmony, structure, timbre, lyrics, and cultural context. The stated goal is to move beyond existing search and personalization models toward more interactive and contextual music discovery, while also encouraging artist adoption of AI-based creation tools. UMG and NVIDIA emphasize that the collaboration is framed around “responsible AI,” with safeguards intended to protect artists’ works, respect copyright, and ensure proper attribution. The partnership reflects UMG’s broader strategy of engaging with AI developers to shape how generative and discovery technologies are deployed in the music industry. #AICopyright#MusicIndustry#ResponsibleAI#AIRegulation

AI & Law

@ai_and_law · Post #730 · 24.12.2025 г., 08:04

🇺🇸🎼Cross-Border AI Music on Trial Independent musicians in Illinois have filed the first U.S. federal lawsuit targeting foreign-owned AI music generators, alleging copyright infringement and unfair practices by Mureka, an AI platform operated by Kunlun Tech Co., Ltd and Skywork AI Pte. Ltd. In Attack the Sound et al. v. Kunlun et al., plaintiffs claim that Mureka was trained on copied and stored sound recordings and musical works without permission, and that users can upload songs as “reference tracks” to imitate music or lyrics without consent or compensation. The complaint seeks injunctive relief and damages, alleging violations of U.S. copyright law, the DMCA, and the Illinois Biometric Information Privacy Act, including claims tied to voiceprints. Plaintiffs argue that Mureka—marketed as an “ultimate AI song generator” and used by more than 10 million users—directly competes with creators as a cheaper substitute for human creativity, disproportionately harming independent artists lacking label bargaining power. Filed by counsel from Loevy + Loevy, the case follows similar actions against U.S.-based AI music firms and is positioned as a landmark test of whether large-scale AI music systems owned abroad can operate in the U.S. market while respecting domestic IP and biometric protections. #AI#Copyright#MusicIndustry#IP

AI & Law

@ai_and_law · Post #394 · 11.09.2024 г., 07:04

Criminal Indictment Exposes $10 Million AI Music Streaming Fraud In a groundbreaking case, a North Carolina musician, Michael Smith, has been indicted for orchestrating a massive streaming fraud scheme that allegedly exploited AI-generated tracks to rake in over $10 million in royalties. This marks the first criminal case involving artificially inflated music streaming, highlighting the emerging risks as AI tools become more embedded in the music industry. Smith is accused of partnering with an AI music company to create a vast library of tracks, which he then fraudulently boosted using a network of bot accounts across major platforms like Spotify, Apple Music, and YouTube Music. The complex scheme, which began in 2017 and continued through 2024, involved deceiving distributors, financial institutions, and even the Mechanical Licensing Collective (MLC), which eventually caught on and halted royalty payments. This case underscores the growing challenge of maintaining integrity in the digital music ecosystem as AI continues to evolve. As the DOJ takes action, the music industry must ramp up efforts to detect and prevent such fraudulent activities to protect legitimate creators and maintain trust in digital platforms. #AI#MusicIndustry#StreamingFraud#DigitalLaw#Copyright