Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
Выручка крупнейших российских компаний в сфере HR-Tech в 2024 году выросла на 38%, до 99,3 млрд руб.
Smart Ranking проанализировала финансовые показатели 80 крупнейших российских компаний в сфере автоматизации HR-процессов за 2024 год. В обзоре рассматриваются итоги работы организаций по сегментам рынка.
Ключевые выводы:
• больше половины рынка приходится на сервисы по подбору персонала — 50 млрд руб. Лидер — HeadHunter, его выручка составила 36,1 млрд руб. Компания заработала на 34% больше, чем в 2023 году;
• фокус бизнеса смещается с подбора персонала на его удержание. Поэтому, как считает Smart Ranking, бизнес сокращает бюджеты на наем новых сотрудников;
• выручка платформ для поиска подработки и найма внештатных сотрудников выросла на 59%, до 32,1 млрд руб. Доля рынка составила 32,4%. Крупнейшие компании — Ventra Go!, Wibedo и GigiWork;
• выручка комплексных решений для HR-задач увеличилась на 23%, до 7,7 млрд руб. Доля рынка составила 7,8%. Лидеры — VK Tech, «Поток», Saby HRM;
• по данным Smart Ranking, в 2024 году многие компании сократили расходы на автоматизацию HR-процессов. Причины — высокая ключевая ставка и смещение бюджетных приоритетов;
• авторы обзора считают, что в 2025 году будет расти спрос на наем по навыкам, а не по должностям.
Ознакомиться с обзором →
#HRTech
#вакансия#dwh#hrtech#sql#pyspark
Инженер данных в команду DWH HR Tech
Москва, Санкт-Петербург
Офис или гибрид
Ищем дата-инженера, который будет заниматься созданием и развитием DWH в HR. Вы будете в центре создания экосистемы аналитических продуктов по ключевым метрикам: найму, движению, обучению, вовлечённости и другим аспектам жизни сотрудников компании. Этими продуктами ежедневно пользуются руководители подразделений всего Яндекса и сотрудники отдела персонала при принятии решений.
Вам предстоит участвовать в процессе создания и проработки архитектуры DWH. Вы будете тесно общаться с аналитиками, заказчиками и держателями данных для улучшения качества поставляемых данных в DWH.
Мы ждём, что вы уверенно владеете SQL и Python, имеете опыт работы с PySpark.
По всем вопросам, а также с резюме в лс к @irinavlsv.
🌐📖Holistic AI: “AI Regulations in 2026” Maps Compliance by Sector
Holistic AI released a new ebook, AI Regulations in 2026, describing 2025 as a mixed year for AI regulation: policy attention remained high in HR tech, financial services, insurance, and generative AI, while both the US and EU made efforts to soften or withdraw certain AI rules. The report shifts from a country-by-country format to a sector-based approach to help organizations identify relevant obligations by use case.
Key themes highlighted include non-discrimination and transparency in HR tech (including notice requirements and bias audits), sandbox-style oversight for AI in financial services, and insurance-specific regulation alongside reliance on existing regulatory frameworks, including laws such as Colorado’s SB169. The ebook also notes increasing scrutiny of AI-driven dynamic pricing in the US, targeting areas such as rent and ticket pricing.
Generative AI remains a regulatory priority globally, with laws focusing on deepfakes, AI use in the judiciary, and AI companions with disclosure requirements. The report emphasizes that risk-based frameworks, especially the EU AI Act, continue to shape global approaches, while international cooperation is growing through initiatives linked to UNESCO, the UN, the Council of Europe, and ASEAN. Holistic AI recommends proactive compliance through system inventorying and lifecycle safeguards.
#AIRegulation#AIGovernance#Compliance#EUAIAct#HRTech#FinTech
Пермский край — пилотный регион для ИИ-ассистента рекрутеров от HeadHunter
Наш регион вошёл в число первых, где тестируют революционный сервис для автоматизации найма. В пилоте уже участвуют 22 пермские компании.
Как это работает?
AI-ассистент помогает на ключевых этапах:
1. Составляет вакансию: Превращает описание задачи от работодателя в структурированный черновик.
2. Ищет и коммуницирует: Сам находит кандидатов в базе hh.ru, пишет им, уточняет детали, отвечает на вопросы.
3. Анализирует отклики: Обрабатывает резюме и переписку, сортирует кандидатов по соответствию и готовит сжатые выводы для рекрутера.
Важно: ИИ не принимает решений, а лишь предоставляет аналитику. «Человеческое» решение остаётся за специалистом.
Дальнейшие планы:
Декабрь 2025: сервис станет доступен почти половине работодателей на hh.
Начало 2026: окончание пилота и масштабирование на всех клиентов.
Подана заявка на регистрацию товарного знака «ИИ-помощник».
Это значимое событие для цифровизации бизнес-среды Пермского края.
#Рекрутинг#HRTech#HeadHunter#Ии#ПермскийКрай#Бизнес#ТочкаКипенияПермь
B2BASEAN на People Forum от Ведомостей!
2 июля команда B2BASEAN погрузится в мир инноваций HR и управления людьми на отраслевом событии — Форуме Ведомости «People Forum»!
Место: "Московский Императорский Яхт Клуб"
Готовы увидеться и пообщаться на полях Форума!
Следите за нашими анонсами!
#B2BASEAN#PeopleForum#Ведомости#HR#УправлениеПерсоналом#HRTech#Инновации#Форум
#спикеры
Друзья, цифровые технологии уже не просто поддерживают HR — они становятся его полноценным инструментом влияния.
Как использовать цифру с умом, не теряя человеческого подхода? Обсудим на секции «Цифра в руках HR».
Темы и спикеры:
🔹 Эффективные цифровые инструменты адаптации и обучения сотрудников
— Руслан Демьяненко, директор Talent Rocks, эксперт в HR-Tech и мобильных решениях
🔹 Цифровая модель карьеры. Как выдержать конкуренцию с AI?
— Екатерина Сухобаевская, основатель HR-агентства «Осознанная карьера», HRD и карьерный стратег
📅 Когда: 3–4 июня
📍 Где: Кластер Ломоносов
🎟Подробнее на сайте
#HREXPOPRO#цифровойHR#HRtech#карьерабудущего#искусственныйинтеллект#адаптация#спикеры