Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Tired of Political Negativity? Try This Instead #shorts#shortsvideo
#positivity#hopefulmessage#politicalspeeches#inspiration#positivethinking#uplifting#motivation#politics#hope#shortscontent#shortsvideo#solutions
https://pdmovies.substack.com/p/frank-capras-meet-john-doe-1941
Stack AI Secures $16M Funding
Stack AI raises $16.08M to enhance productivity by integrating AI with various data sources, enabling organizations to better utilize AI technology. More information can be found at Stack AI.
#Funding#AI#Productivity#Data#Tech#Innovation#Investment#Integration#Business#Startups#Growth#Automation#Solutions#Enterprise#Analytics#Software#Digital#Tools
Keepit Secures $50M Funding
Keepit raises $50M in funding to enhance its cloud data protection services, leveraging over 20 years of market experience. For more details, visit Keepit.
#Funding#Cloud#DataProtection#Keepit#Investment#Tech#Services#Solutions#Market#Experience#Ecosystem#Security#Innovation#Growth#Infrastructure#Digital#Software#Business#Technology
Coblocks Secures $500K Funding
Coblocks has successfully raised $500K in funding as of December 4, 2024. The platform offers unified tooling, instant deployment, and seamless collaboration in one streamlined solution.
#Coblocks#Funding#Tech#Startup#Platform#Collaboration#Deployment#Innovation#Investment#Tools#Startups#InvestmentRound#FundingRound#Financing#Growth#Technology#Business#Software#Solutions#Digital
AI Co-Pilot Boosts Architecture Design
ArchiLabs raises $500K for its AI co-pilot, designed to enhance architecture efficiency. By utilizing simple AI prompts, architects can significantly speed up their design processes, increasing productivity tenfold.
#AI#Architecture#Funding#Design#Efficiency#Productivity#Tech#Innovation#Startups#CoPilot#Automation#Archilabs#Creative#Tools#Software#Solutions#Investment#Entrepreneurship#Prompts#Future
Bnewable Secures $42M Funding
Bnewable raises $42.02M to enhance energy solutions, focusing on battery-as-a-service and smart energy management systems. Energy management becomes increasingly vital for companies.
#Bnewable#Funding#Energy#Management#Tech#BatteryAsAService#Sustainable#Innovation#SmartSystems#Utilities#Investment#Startups#CleanEnergy#Solutions#Growth#Development#Industry#Future#Strategy#Services
$500K Funding for Symphony
Symphony has successfully raised $500K in funding for its Conversational AI Recruiter, which streamlines the hiring process for customer-facing roles. This funding round took place on December 4, 2024. More details can be found on their website: Symphony.
#Funding#AI#Recruitment#ConversationalAI#Tech#Startups#Innovation#CustomerService#Hiring#Automation#Career#JobMarket#Business#Solutions#Entrepreneurship#Growth#Investment#Operations#Talent#Workforce#DigitalTransformation
Funding Rounds Update: January 2025
In January 2025, notable funding rounds included:
- Beams secured $9M for a renovation platform enhancing home planning, design, and building. Learn more
- KamiwazaAI raised $8.5M, aiming to revolutionize enterprise AI with 1 trillion daily inferences. Learn more
- CyGO Entrepreneurs garnered $5.16M for their business initiatives. Learn more
- Oh obtained $4.5M for digital twin interactions. Learn more
- Varadise received $3M for AI-driven construction solutions. Learn more
- Jinli Intelligence brought in $2.73M for intelligent technology solutions. Learn more
- Origami Agents raised $2M for their internet research tracking services. Learn more
- Novastro secured $1.2M for their L2 chain applications. Learn more
- RePut.ai raised $1M for AI tools. Learn more
- Quash garnered $635K to automate bug reporting for developers. Learn more
#Funding#Startup#AI#Construction#Tech#DigitalTwin#Automation#Enterprise#Research#Platform#Solutions#VC#Innovations#Web#Data#Efficiency#BugReporting#DigitalTransformation#Kamiwaza#Beams
Gander Raises $500K for AI Solutions
Gander has secured a funding round of $500K, announced for December 4, 2024. The company focuses on assisting airlines in creating flexible, AI-powered workflows that enable customers to request reimbursements and compensation efficiently.
#Funding#AI#Airlines#Reimbursement#Compensation#Workflows#Finance#Tech#Innovation#CustomerService#Gander#Investment#Startup#Digital#Support#Flexibility#Solutions#Technology#Efficient#CustomerExperience