TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 3 слични објави

Пребарај: #uspto

当前筛选 #uspto清除筛选
AI & Law

@ai_and_law · Post #523 · 11.03.2025 г., 08:04

🇺🇸USPTO Withdraws AI Strategy Amid Policy Shift The U.S. Patent and Trademark Office (USPTO) has officially withdrawn its AI strategy document, published in January 2025. Acting Director Coke Morgan Stewart cited that the strategy was influenced by Biden-era executive orders, which have since been rescinded by the Trump administration. The new AI policy direction focuses on deregulation and strengthening U.S. global AI dominance—though specific implementation details remain unclear. Key legal questions now come to the forefront: Will the U.S. redefine AI inventorship, potentially allowing corporations to be named as inventors? And how aggressively will the USPTO integrate AI into the patent examination process? These issues could reshape both intellectual property law and AI governance in the years ahead. #AI#PatentLaw#USPTO#AIGovernance#AIRegulation

AI & Law

@ai_and_law · Post #713 · 01.12.2025 г., 08:04

🇺🇸USPTO Reframes AI-Assisted Invention: Human Inventorship Remains the Rule The U.S. Patent and Trademark Office has issued new guidance confirming that AI may support invention but it cannot share or replace inventorship. The USPTO rescinded last year’s AI-specific guidelines and returned to a uniform standard: the same inventorship test applies to all inventions, regardless of whether AI was used in the process. Generative AI is now formally treated as “laboratory equipment” or any other research tool that assists a human creator, not as a co-inventor. Notably, the Office rejected the prior administration’s “joint inventorship”-based framework for determining patentability of AI-assisted inventions. Instead, examiners must ask a single question: did a natural person conceive the invention under traditional doctrine? Courts have already held that AI systems cannot receive patents, but they have not yet ruled on the boundaries of human inventorship when AI is deeply embedded in R&D. This updated guidance will likely shape that future litigation. #AIandLaw#IntellectualProperty#PatentLaw#AIRegulation#USPTO#AIGovernance

AI & Law

@ai_and_law · Post #247 · 23.02.2024 г., 08:04

OpenAI's Trademark Application for 'GPT' Denied Greetings everybody! The US Patent and Trademark Office (PTO) has rejected OpenAI's bid to trademark the term 'GPT' (generative pre-trained transformer), citing its generic nature. According to the PTO, granting the trademark could impede competitors from accurately describing their products as GPT. OpenAI argued that 'GPT' isn't merely descriptive and doesn't immediately convey its meaning to consumers. However, the PTO emphasized that those familiar with the technology understand 'GPT' as a general type of software, not exclusive to OpenAI products. The decision marks a setback for OpenAI, whose association with 'GPT' grew significantly with the popularity of ChatGPT and its subsequent AI models. Despite previous denials, OpenAI may appeal to the Trademark Trial and Appeal Board for another chance to secure the trademark. #OpenAI#GPT#Trademark#USPTO#AI