Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Tencent интегрирует WeChat с ИИ-агентом OpenClaw на фоне технологической войны в Китае
🕹 Компания Tencent запустила инструмент для интеграции своей платформы обмена сообщениями WeChat с агентом OpenClaw, углубляя свои усилия по внедрению ИИ-агентов, которые стали ключевым полем битвы между китайскими технологическими компаниями.
📌 Программное обеспечение под названием ClawBot будет отображаться в качестве контакта в WeChat, позволяя пользователям самого популярного в Китае приложения с более чем 1 миллиардом активных пользователей в месяц напрямую взаимодействовать с OpenClaw.
✅ Пользователи могут отправлять и получать команды для взаимодействия с агентом ИИ через интерфейс обмена сообщениями.
➡️ Интеграция происходит на фоне растущей популярности OpenClaw, агента с открытым исходным кодом и искусственным интеллектом, способного выполнять такие задачи, как передача файлов и отправка электронных писем от имени пользователей.
📍 Пользователи поспешили установить и поэкспериментировать с продуктами, созданными на основе агентов, что побудило технологические компании изучать возможности для бизнеса, несмотря на предупреждения властей о рисках для безопасности.
➡️ Интеграция WeChat в решения Tencent последовала за запуском компанией в начале этого месяца собственного пакета инструментов для работы с ИИ-агентами, включающего QClaw для индивидуальных пользователей, Lighthouse для разработчиков и WorkBuddy для предприятий.
Источник: Reuters
@chinastocksnet
Если полезно, поставьте лайк 👍😇
#Tencent
📞 Навигация по каналам
▪️Акции▪️Облигации
▪️Китай ▪️Трейдинг
▪️Новости▪️Клуб
Рост продаж Tencent на 13% обусловлен расширением масштабов внедрения искусственного интеллекта
📈 Компания Tencent Holdings Ltd. сообщила о росте выручки на 13%, которая за три месяца, закончившихся в декабре, выросла до 194,4 млрд юаней.
🕹 Компания делает большую ставку на агентный искусственный интеллект, и ожидается, что инвестиции в эту область как минимум удвоятся в этом году по сравнению с примерно 18 миллиардами юаней в 2025 году.
✅ Компания Tencent выпустила множество продуктов, использующих популярный фреймворк OpenClaw, и разрабатывает встроенного в WeChat ИИ-агента, призванного помочь пользователям автоматизировать задачи.
Источник: Bloomberg
@chinastocksnet
Если полезно, поставьте лайк 👍😇
#Tencent
📞 Навигация по каналам
▪️Акции▪️Облигации
▪️Китай ▪️Трейдинг
▪️Новости▪️Клуб
Tencent начала тестирование QClaw, обеспечивающего развертывание OpenClaw в один клик с интеграцией WeChat и QQ
✅ Компания Tencent начала внутреннее тестирование QClaw, пакета развертывания в один клик, разработанного для упрощения использования агентской платформы OpenClaw.
🟢 Вместо внедрения новой системы агентов, QClaw интегрирует существующую систему OpenClaw в более удобный для пользователя продукт, значительно снижая барьер для развертывания и использования.
📌 Согласно документации по тестированию, QClaw функционирует как локальный лаунчер, запускаемый одним щелчком мыши. После загрузки пакета пользователи могут развернуть OpenClaw непосредственно на своих компьютерах и быстро запустить агента ИИ по имени «Лобстер». Пользователи, у которых уже установлен OpenClaw, также могут подключаться к своим существующим системам и управлять ими через QClaw.
➡️ Платформа по умолчанию поддерживает множество популярных крупных моделей, включая Kimi, MiniMax, GLM и DeepSeek, а также позволяет пользователям интегрировать дополнительные модели.
❇️ Одной из примечательных особенностей является интеграция с социальными платформами Tencent. Благодаря подключению WeChat и QQ пользователи могут напрямую взаимодействовать с агентом OpenClaw через окна чата и удаленно запускать задачи на своих локальных компьютерах.
Источник: Pandaily
@chinastocksnet
Если полезно, поставьте лайк 👍😇
#Tencent
📞 Навигация по каналам
▪️Акции▪️Облигации
▪️Китай ▪️Трейдинг
▪️Новости▪️Клуб
Ubisoft и Tencent договорились о слиянии Vantage Studios на 4 миллиарда евро
✅ Компания Ubisoft сообщила в пятницу о завершении инвестиций Tencent в Vantage Studios — новое подразделение, созданное вокруг франшиз Assassin's Creed, Far Cry и Tom Clancy's Rainbow Six.
📌 Сделка оценивает Vantage по предварительной стоимости предприятия в 3,8 млрд евро (4,37 млрд долларов США) и включает в себя вливание 1,16 млрд евро от Tencent за 26,32% акций.
➡️ Ubisoft сохраняет исключительный контроль над дочерней компанией.
📌 Согласно соглашению, Tencent обязуется удерживать свою долю в Vantage в течение пяти лет, если только Ubisoft не потеряет контрольный пакет акций. Ubisoft обязана сохранять контрольный пакет акций не менее двух лет. В случае смены собственника Ubisoft в результате сделки, одобренной советом директоров, компания может выкупить акции Tencent по рыночной цене, но в случае отказа Tencent может принудительно продать акции.
Источник: Reuters
@chinastocksnet
Если полезно, поставьте лайк 👍😇
#Tencent
Apple и Tencent договорились о 15%-ном сокращении расходов на приложение WeChat Mini
🕹 Компания Tencent Holdings Ltd. заключила сделку с Apple Inc. , согласно которой производитель iPhone будет обрабатывать платежи и получать 15% от покупок в мини-играх и приложениях WeChat. Это положит конец громкому спору, который не утихает на крупнейшей в мире арене смартфонов.
🔹 Лидер китайской социальной сети и американская компания вскоре раскроют подробности своего соглашения, которое было достигнуто после более чем года переговоров, сообщают источники, знакомые с ходом обсуждения. Чтобы получить право на участие, разработчикам необходимо согласиться с определёнными требованиями Apple к программному обеспечению, например, с требованием предоставить родителям информацию о возрасте ребёнка, сообщил один из источников.
*️⃣ Согласованная ставка значительно ниже типичной 30%-ной комиссии для iPhone, но открывает новый источник дохода для Apple и снимает нагрузку с Tencent, которая управляет приложением WeChat, играющим ключевую роль в жизни большинства китайцев. Apple потребовала от Tencent закрыть лазейки, которые разработчики приложений использовали для перенаправления пользователей на внешние платёжные системы в обход фреймворка iPhone.
«У нас очень хорошие отношения с Apple, и мы сотрудничаем во многих областях», — заявил президент Tencent Мартин Лау в ходе телефонной конференции после публикации финансовой отчетности в четверг. «Мы обсуждаем с Apple возможность сделать экосистему мини-игр более динамичной. В какой-то момент, возможно, будет сделано официальное заявление».
Источник: Bloomberg
@chinastocksnet
Если полезно, поставьте лайк 👍😇
#Tencent
Рост Tencent на 280 миллиардов долларов может продолжиться на фоне роста доходов от игр
🕹 Поскольку растут опасения по поводу концентрации в технологических акциях на фоне возможного пузыря на рынке искусственного интеллекта, инвесторы вкладывают средства в акции Tencent Holdings Ltd., считая их более безопасным вариантом.
✅ Ожидается, что компания станет одной из немногих китайских технологических гигантов, которые отчитаются о положительном росте прибыли в предстоящих финансовых результатах, поскольку жесткие ценовые войны негативно сказываются на прибыли конкурентов. Высокие результаты в сегменте онлайн-игр могут способствовать продолжению ралли, которое в этом году увеличило рыночную стоимость Tencent примерно на 280 миллиардов долларов.
📈 В этом месяце акции выросли на 4,5%, отражая этот оптимизм, в то время как конкуренты Alibaba Group Holding Ltd. и JD.сom Inc. упали на Гонконгской фондовой бирже. С начала этого года «медведи» отступили на рынке Tencent: по данным S&P Global, короткие продажи акций составили менее 0,1% от объёма акций в свободном обращении.
Источник: Bloomberg
@chinastocksnet
Если полезно, поставьте лайк 👍😇
#Tencent
🤖 CEO Tencent Пони Ма о раннем этапе развития холдинга, роли продаж и судьбе:
🛒 Мы постоянно пытались продать #Tencent, но никто не собирался покупать. Мы не могли продать QQ (первая социальная сеть компании, MAU до сих пор в районе 850 млн), поэтому продолжали развивать проект самостоятельно.
💸 Раньше в г.Шэньчжэнь не было VC. Нам повезло, что прямо перед крахом пузыря доткомов мы привлекли $2 млн.
💠#Tencent
Your Number is Your Name.
Your Name is Your Number.
💥#Phoneword🌱
🔥 Unique & Unforgettable
🚀 A number you can not forget.
+888 0 TENCENT
+888 0 836 23 68
👇👇👇
Fragment.com/number/88808362368
&
🌐GetGems.io
🌐Phoneword Collection
#Phoneword
👇
🌐en.m.wikipedia.org/wiki/Phoneword
📡@Phoneword
🙏🌱
⚡️Tencent выпустили новые open-source модели перевода HY-MT 1.5
Модель доступна в двух версиях: 1.8B и 7B. Обе работают как на устройстве, так и в облаке и показывают высокую скорость и точность.
Модель идет в двух размерах:
1) 8B для устройств
Оптимизирована под потребительское железо, занимает около 1 ГБ памяти.
Благодаря on-policy distillation достигает задержки 0.18 секунды на 50 токенов, обходя многие коммерческие API.
2) 7B новая SOTA
Превосходит большинство средних по размеру open-source моделей и сопоставима с закрытых решений.
Поддержка 33 языков и 5 китайских диалектов с высокой точностью.
Модели уже используются в сервисах Tencent. Связка двух моделей обеспечивает стабильную работу как на устройствах, так и в облаке.
🔹Попробовать: https://hunyuan.tencent.com/modelSquare/home/list
🔹GitHub: https://github.com/Tencent-Hunyuan/HY-MT
🔹Hugging Face: https://huggingface.co/collections/tencent/hy-mt15
@ai_machinelearning_big_data
#opensource, #Tencent,
Tencent и Alibaba ведут переговоры об участии в первом раунде финансирования DeepSeek
✅ Компании Tencent Holdings Ltd. и Alibaba Group Holding Ltd. ведут переговоры об участии в раунде финансирования китайского пионера в области искусственного интеллекта DeepSeek.
🕹 Компания Tencent предложила приобрести до 20% акций DeepSeek, но стартап не горит желанием уступать столь значительную долю контроля.
➡️ Переговоры продолжаются, при этом ориентировочная оценка компании составляет около 40 миллиардов долларов, исходя из показателей публичных конкурентов, таких как MiniMax Group Inc.
Источник: Bloomberg
@chinastocksnet
Если полезно, поставьте лайк 👍😇
#BABA#Tencent
📞 Навигация по каналам
▪️Акции▪️Облигации
▪️Китай ▪️Трейдинг
▪️Новости▪️Клуб