Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
✔️Mistral AI представила Mistral 3 - новое семейство открытых ИИ-моделей, рассчитанных на работу где угодно: от ноутбуков и смартфонов до облаков и edge-устройств.
Линейка включает флагманскую Mistral Large 3 и компактные Ministral-модели - все под лицензией Apache 2.0 с коммерческим использованием.
Модели оптимизированы для широкого спектра задач: от работы на устройствах с ограниченными ресурсами до корпоративных нагрузок.
- Mistral Small 3 вышла на уровень свыше 81 % на MMLU: для компактной модели это очень высокий показатель при низких задержках.
- Mistral Medium 3.1 заняла верхние позиции в LM Arena: первое место в категории English (no style control), второе, в общем зачёте, плюс топ-3 в задачах кодирования и длинных запросов.
- Medium 3.1 показывает около 90 % качества «тяжёлых» моделей, но при существенно меньших ресурсных затратах - одно из лучших соотношений цена/производительность на рынке.
https://mistral.ai/news/mistral-3
@ai_machinelearning_big_data
#mistral#ml
✴️Mistral OCR 3: новый рубеж в «умном» распознавании документов
Mistral представила OCR 3 — систему, которая заявляет лидерство по точности и эффективности, обгоняя как корпоративные решения для документооборота, так и AI-native OCR. Модель предназначена для производительных пайплайнов извлечения данных, где важны качество, скорость и стоимость.
API и песочница доступны в Mistral AI Studio: можно сразу прогнать свои файлы в Document AI playground и оценить качество парсинга, стабильность на реальных PDF/сканах и затраты перед интеграцией в прод. В блоге — метрики, цены и кейсы.
Где почитать и попробовать:Mistral OCR 3 — блог • Mistral AI Studio (Document AI playground)
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#новости#нейросети#mistral
✴️Французы опять что-то мутят
Mistral выпускает свою вайбкодинг CLI - Vibe, вместе с Devstral 2, моделька в двух вариантах. По бенчмаркам выглядит так себе, но учитывая размер, вроде даже не плохо, кто хочет - пробуйте
🟡Установка:uv tool install mistral-vibe
🟡Лицензия:Apache 2.0
🟡Модель под капотом:Devstral 2 (два размера — 123B и 24B, оба в опенсорсе)
🟡Производительность: старшая Devstral 2 по метрикам на уровне DeepSeek-V3.2 и Kimi K2 Thinking
🟡Подробнее и старт:Анонс Mistral Vibe
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#mistral
✴️Mistral 3: новое поколение открытых мультимодальных моделей
Один из немногих адекватных европейских ИИ-стартапов выдал новую линейку. Мистралы уже давно не конкурируют с топ моделями, поэтому не думаю что большая модель будет интересной кому-либо, но вот мелкие модели у них получаются достаточно хорошими
Mistral представила семейство Mistral 3: три компактные Ministral 3B/8B/14B (плотные) и Mistral Large 3 (MoE) с 675B общих / ~41B активных параметров. Все релизы идут под Apache 2.0, поддерживают мультиязычие и vision, а Large 3 обучали на ≈3 000 GPU H200.
Что важно для практики: у «министралей» есть base / instruct / reasoning-варианты (все с пониманием изображений), делают ставку на эффективный деплой (квантизация, малые VRAM), а Large 3 — «фронтирный» MoE для задач с большим контекстом и мультимодальностью. Партнёрства с NVIDIA, vLLM, Red Hat закрывают путь от дата-центров до роботов. TechCrunch о релизе,Red Hat о vLLM-интеграции.
Коротко по линейке
🟡Ministral 3B/8B/14B:base / instruct / reasoning, vision, мульти-язык; заточены под edge-запуски и быстрые продукты.
🟡Mistral Large 3 (MoE):675B total / ~41B active, мультимодальность, большой контекст; «фронтир» под сложные пайплайны.
🟡Лицензия:Apache 2.0 для всех чекпоинтов (open-weight).
Ссылки для старта:Mistral 3 (анонс) • Hugging Face: Mistral Large 3 Instruct • Ministral 3 Reasoning 8B
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#новости#mistral#нейросети
✴️Mistral AI Studio: крупное обновление для агентов и моделей
Mistral обновила AI Studio — среду, где можно создавать ИИ-агентов, обучать/тонко настраивать модели и управлять их запуском. В релизе — более быстрый интерфейс, оптимизированные воркфлоу и улучшенная организация командной работы. Попробовать можно здесь: Mistral AI Studio.
Что поменялось
🟡Усилены инструменты обучения и деплоя — легче собирать и выкатывать модели.
🟡Единое место для агентов и их координации — меньше «склеек» между шагами.
🟡Новые вкладки «Наблюдение» и «Оценка» — мониторинг и метрики; ещё функции подъедут позже.
🟡Быстрее и понятнее эксперименты — UI стал интуитивнее для быстрых итераций.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#mistral
⚡️Le Chat получил мощное обновление — теперь умнее и интереснее
🟡Deep Research — быстрые и структурированные отчёты по сложным темам. Погружение в детали без лишнего шума.
🟡Голосовой режим — благодаря модели Voxtral теперь можно разговаривать с Le Chat голосом прямо на ходу.
🟡Мультиязычный ризонинг — бот умеет рассуждать и давать сложные ответы на любом языке, используя модель Magistral.
🟡Проекты — появилась поддержка контекстных папок, чтобы хранить и организовывать диалоги.
🟡Промт-редактор изображений — можно не только генерировать, но и редактировать картинки по текстовому описанию.
🤖 Пробовать тут — chat.mistral.ai
📄 Все детали в блоге
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#новости#нейросети#mistral
⚡️Mistral готовят режим Deep Research и поддержку памяти
Во внутренней системе уже засветилась новая модель — mistral-deepresearch-2507, а значит релиз может быть совсем близко. Также Mistral работает над:
🟡Проектами — чтобы сохранять и развивать диалоги по темам
🟡Памятью — чтобы ИИ запоминал важные детали и контекст
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#новости#нейросети#mistral
🎙 Mistral выкатили новую линейку open source моделей распознавания речи — дешевле и точнее Whisper
Новое имя — Voxtral, и в релиз вошли сразу три модели:
🟡Voxtral Mini
🟡Voxtral Mini Transcribe
🟡Voxtral Small
Главное:
🟡 Mistral заявляют, что Voxtral уверенно обходит Whisper large-v3 от OpenAI — как по точности (ниже WER), так и по скорости
🟡 Модели работают быстрее и требуют меньше ресурсов, доступны для локального запуска
🟡 Новый прайсинг: дешевле, чем существующие решения, при сохранении качества
Попробовать:
🔼 Через API: console.mistral.ai
🤖 В чате: chat.mistral.ai
📂 Скачать модели: huggingface.co/mistralai
📄 Блог с подробностями: mistral.ai/news/voxtral
🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI
#mistral#нейросети#новости
🇫🇷Три модели Mistral теперь в GPTunneL
Добавили нейросети от французской компании Mistral AI — одной из самых технологичных команд на рынке. Их модели точны, быстры и отлично работают с длинными контекстами и кодом.
❤️Mistral Medium 3 — производительная и доступная модель с контекстом до 128 000 токенов. Отлично справляется с кодом, языковыми и мультимодальными задачами.
❤️Mistral Small 3.1 — компактная, но мощная модель с контекстом 128 000 токенов и скоростью до 150 токенов/сек. Хорошо справляется с текстом, кодом и мультимодальностью.
❤️Mistral Small (бесплатная) — облегчённая open-source версия, доступная без ограничений. Подходит под простые задачи.
⏩️ Все три модели уже доступны в GPTunneL — тестируйте в работе!
🔗Mistral Medium 3
🔗Mistral Small 3.1
🔗Mistral Small (бесплатная)
#update@gptunnel#mistral@gptunnel
⚡️ ChatGPT’ning kuchli raqibi — Le Chat yangilandi!
Mistral sun’iy intellekti asosida ishlovchi Le Chat endi yanada kuchliroq bo‘ldi va quyidagi imkoniyatlarga ega:
🎨Rasm yaratish – eng yuqori darajadagi Flux Ultra modeli qo‘shildi
🖌Le Canevas – xuddi ChatGPT’dagi Canvas kabi vizual ish maydoni
🔎Qidiruv – o’zbek ham tilida ishlaydi
📄PDF o‘qish – hujjatlarni tezkor tahlil qilish va qisqacha mazmun chiqarish
💻Kod yozish va testlash – dasturlarni yaratish va murakkab masalalarni yechish
⚡Tezkor yozish – sekundiga 1000 ta so‘z ishlab chiqadi
💰Eng muhimi – bularning barchasi BEPUL!
DeepSeek lag bo‘layotgan paytda Le Chat sinab ko‘rishga arziydi! 🚀
#AI#Mistral#LeChat
Mistral AI 首席执行官提议欧洲对人工智能企业征收在线公开内容使用税
Mistral AI 联合创始人兼首席执行官 Arthur Mensch 提议欧洲对人工智能企业征收在线公开内容使用税。Mensch 指出,欧洲企业在 AI 训练数据使用方面受到更严格的版权约束,而域外企业则可规避现有保护措施,导致欧洲 AI 企业竞争力下降,内容方收益受损。Mistral AI 建议对所有在欧洲提供服务的 AI 企业征收基于收入的税费,所得资金用于投资新内容创作和支持欧洲文化产业。该税收制度将与现有的 AI 许可授权模式并行。IT之家
🏷#Mistral#AI#人工智能#税费
📢频道👥群组📝投稿