TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #121 · 20 јул.

Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример). Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать? В Django по умолчанию есть готовая функция slugify для таких случаев. Но я её никогда не использую. Почему? Потому что её недостаточно! Приведём пример >>> from django.utils.text import slugify >>> slugify('This is a Title') 'this-is-a-title' Пока всё отлично >>> slugify('This is a "Title!"') 'this-is-a-title' Спец символы удалились, всё хорошо. >>> slugify('Это заголовок статьи') '' Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить >>> slugify('Это заголовок статьи', allow_unicode=True) 'это-заголовок-статьи' Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте. Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою. Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку: 🔸1. Исходный текст: >>> text = 'Мой заголовок №10 😁!' Взял специально посложней со специальными символами. 🔸2. Транслит Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги. from unidecode import unidecode >>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山") 'N S (r) u P 1/4 Yue Shan' Очень крутая библиотека, советую👍 В нашем случае получаем такое преобразование: >>> text = unidecode(text) >>> print(text) 'Moi zagolovok No. 10 !' Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы. А еще наш код уже поддерживает любой язык, будь то хинди или корейский. 🔸4. Фильтр символов Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона. >>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text) >>> print(text) 'Moi_zagolovok_No_10_' Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_". 🔸5. Slugify Осталось удалить лишние символы по краям и сделать нижний регистр >>> text = text.strip('_').lower() >>> print(text) 'moi_zagolovok_no_10' Получаем отличный slug! 😎 🌎 Полный код в виде функции. ______________ PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию. #libs#tricks#django

Резултати

Пронајдени 2 слични објави

Пребарај: #chinaai

当前筛选 #chinaai清除筛选
AI & Law

@ai_and_law · Post #59 · 18.07.2023 г., 07:04

China's new AI measures: boosting generative AI services Hello, everyone! Today we have exciting news from China. On July 13th China released the final version of the Interim Measures for Administration of Generative AI Services. Compared to the previous draft, which was open for public comments in April, the final version showcases a more business-friendly and supportive approach. These AI Measures specifically apply to services that generate text, image, video, and audio content using generative AI technology and are made available to the public in China. With a focus on both development and security, China adopts an "inclusive and prudent" stance. Notably, the final version includes more comprehensive provisions to foster international collaborations on generative AI technology and services, surpassing the scope of the earlier draft. The AI Measures outline a range of legal requirements for performing and utilizing generative AI services. These include adhering to core social values, protecting intellectual property rights and trade secrets, as well as taking effective measures to prevent discrimination, monopoly, and anticompetitive practices when designing algorithms, selecting training data, and creating computing models. While the whistle-blowing mechanism remains intact from the consultation draft, the punitive terms that could result in administrative fines of RMB10,000-100,000 for violations have been removed in the final AI Measures. The AI Measures are set to take effect on August 15th, sending a positive signal to businesses interested in investing, developing, and engaging in generative AI services in China. This move is expected to attract significant investments into China's thriving AI landscape in the coming months and years. #AIRegulations#GenerativeAI#ChinaAI#BusinessInvestments

Crypto M - Crypto News

@CryptoM · Post #64898 · 10.04.2026 г., 07:57

🚀 AI TRENDS | China's AI Industry Alliance Issues Risk Management Guide for Enterprise Security China's AI industry alliance has introduced a risk management guide aimed at enhancing enterprise security governance, similar to OpenClaw. According to NS3.AI, the guide establishes a security framework and self-inspection standards for the deployment, usage, and decommissioning of AI agents. #AI#ChinaAI#EnterpriseSecurity#RiskManagement#SecurityGovernance#AIIndustry#AIagents#NS3AI