Регулярно требуется преобразовать какой-либо текст в максимально совместимый текст для URL, имени файла, имени объекта в каком-то софте и тд. Требования совместимости простые: в тексте должны быть только допустимые символы. Обычно это a-z, 0-9 и "_" или "-". То есть, только прописные буквы латинского алфавита и цифры (как пример).
Допустим, нам нужно название статьи в блоге преобразовать в slug для добавления его в URL этой статьи. Как это лучше всего сделать?
В Django по умолчанию есть готовая функция slugify для таких случаев.
Но я её никогда не использую. Почему? Потому что её недостаточно!
Приведём пример
>>> from django.utils.text import slugify
>>> slugify('This is a Title')
'this-is-a-title'
Пока всё отлично
>>> slugify('This is a "Title!"')
'this-is-a-title'
Спец символы удалились, всё хорошо.
>>> slugify('Это заголовок статьи')
''
Вот и приехали 😢. Если текст не английский то буквы просто игнорируются. Можно это поправить
>>> slugify('Это заголовок статьи', allow_unicode=True)
'это-заголовок-статьи'
Но тогда мы не вписываемся в условие. У нас появилась кириллица в тексте.
Так как я часто пишу сайты для русскоязычных пользователей эта проблема весьма актуальна. Я не использую стандартную функцию и всегда пишу свою.
Оригинал я не беру в расчёт и пишу полностью свою функцию. И так, по порядку:
🔸1. Исходный текст:
>>> text = 'Мой заголовок №10 😁!'
Взял специально посложней со специальными символами.
🔸2. Транслит
Необходимо сделать транслит всех символов в латиницу. Здесь очень выручает библиотека unidecode. Помимо простого транслита кириллицы в латиницу она умеет преобразовывать спец символы и иероглифы в текстовые аналоги.
from unidecode import unidecode
>>> unidecode("Ñ Σ ® µ ¶ ¼ 月 山")
'N S (r) u P 1/4 Yue Shan'
Очень крутая библиотека, советую👍
В нашем случае получаем такое преобразование:
>>> text = unidecode(text)
>>> print(text)
'Moi zagolovok No. 10 !'
Отличный транслит. Смайл просто удалился, хотя я ждал что-то вроде :). Ну и ладно, всë равно невалидные символы.
А еще наш код уже поддерживает любой язык, будь то хинди или корейский.
🔸4. Фильтр символов
Unidecode не занимается фильтрацией по недопустимым символам. Это мы делаем в следующем шаге через regex. Просто заменим все символы на "_" если они вне указанного диапазона.
>>> text = re.sub(r'[^a-zA-Z0-9]+', '_', text)
>>> print(text)
'Moi_zagolovok_No_10_'
Символ "+" в паттерне выручает когда несколько недопустимых символов идут рядом. Все они заменяются на один символ "_".
🔸5. Slugify
Осталось удалить лишние символы по краям и сделать нижний регистр
>>> text = text.strip('_').lower()
>>> print(text)
'moi_zagolovok_no_10'
Получаем отличный slug! 😎
🌎 Полный код в виде функции.
______________
PS. Проверку что в строке остался хоть один допустимый символ я бы вынес в отдельную функцию.
#libs#tricks#django
🥇NVIDIA RTX 5090 – "Dhahab Edition": oltin bilan qoplangan grafik karta Dubayda namoyish qilindi!
🖥 Bu oddiy RTX 5090 emas. Dubaydagi GITEX Africa 2025 ko‘rgazmasida taqdim etilgan karta 18 karatli 6.5 grammdan iborat haqiqiy oltin bilan bezatilgan bo‘lib, “Dhahab”(arabchada – oltin) deb nomlangan maxsus versiya.
✨ NVIDIA bu modelni o‘zi emas, balki Dubaydagi maxsus butik kompaniya orqali ishlab chiqargan. Dizaynidan tortib, qadoqlanishigacha – hammasi hashamatga yo‘g‘rilgan.
⚙️ Qanday texnik xususiyatlar borligi aytilmagan, ammo ehtimol oddiy RTX5090 bilan bir xil bo‘ladi. Faqat, ustiga NVIDIA Bosh direktori Jensen Xuangning dastxati ham tushirilgan.
🇦🇪 Bu karta kolleksionerlar va Dubaydagi premium texnologiya ishqibozlari uchun mo‘ljallangan.
🧐 Siz olarmidingiz bunday “oltin kartani”?
➡️#nvidia | Birinchi raqamli IT-Blog
💻NVIDIA GeForce RTX 5050: 8 GB GDDR6 xotira va 128-bit shina bilan ta'minlanadi
ℹ️ NVIDIA kompaniyasining yangi byudjet grafik protsessori — GeForce RTX 5050 haqida ma'lumotlar paydo bo'ldi. Ushbu model 8 GB GDDR6 videoxotira va 128-bit shina bilan jihozlanadi. Shuningdek, uning maksimal quvvat sarfi 130 W atrofida bo'lishi kutilmoqda.
⚙️ Ushbu xususiyatlar RTX 5050 modelini o'rta darajadagi grafik kartalar qatoriga qo'yadi. Uning raqobatchisi sifatida AMD RX 9070 modeli ko'rilmoqda. Ammo, to'liq texnik tafsilotlar va chiqarilish sanasi hali e'lon qilinmagan.
➡️#nvidia | Birinchi raqamli IT-Blog
🖥 PowerColor Radeon RX 9070 XT Red Devil: Yangi grafik karta uchun 900 W quvvat manbai talab qilinadi
ℹ️ Yaqinda tarqalgan ma'lumotlarga ko'ra, PowerColor Radeon RX 9070 XT Red Devil grafik kartasi uchun kamida 900 W quvvat manbai talab etiladi. Aytilishicha, unda 64 hisoblash bloklari va 3,0 GHz chastotada ishlovchi grafik protsessor, 3 ta 8-pinli quvvat ulagichi mavjud bo'ladi.
🆚 Taqqoslash uchun, PowerColor RX 9070 Reaper modeli uchun 650 W, RX 9070 XT Reaper uchun esa 750 W quvvat manbai kifoya qiladi.
➡️#nvidia | Birinchi raqamli IT-Blog
💻NVIDIARTX 5070 Ti rasmiy sotuv oldidan paydo bo‘ldi
⚙️ Asosiy xususiyatlar:
- 8960 CUDA yadrosi
- 16 GB GDDR7 xotira
- 256-bit shina kengligi
- 300 W energiya iste’moli
💸 Tavsiya etilgan narx — 749$, lekin ayrim Yevropa do‘konlarida 1300-1400 yevro atrofida sotilmoqda.
📅 Rasmiy sotuv 20-fevraldan boshlanishi kutilmoqda.
➡️#nvidia | Birinchi raqamli IT-Blog
💻Arzon mikrofon ovozini studiya darajasiga aylantiramiz — NVIDIA “Broadcast” dasturiga “Studio Voice” funksiyasini qo‘shdi.
ℹ️ Ishlatish juda oson — funksiyani yoqamiz va yozishni boshlaymiz. Natijada, toza va sifatli ovoz hosil bo‘ladi, qo‘shimcha sozlamalar kerak emas.
⬇️ Dasturni bepul yuklab oling: https://nvda.ws/4aKY2N6
➡️#nvidia | Birinchi raqamli IT-Blog
💻 RTX 5080 va RTX 5090 narxlari haqida ilk taxminlar
ℹ️ Yaqinda tarqalgan ma’lumotlarga ko‘ra, NVIDIA’ning keyingi avlod RTX 5080 va RTX 5090 grafik kartalari $899 va $1599 dan boshlanadigan narxlarda chiqishi mumkin. Bu hali rasmiy ma'lumot emas.
⚙️ Insayderlar ushbu avlod AD200 chip arxitekturasida ishlab chiqarilishini ta’kidlashmoqda. Energiya sarfi yuqori bo‘lishi mumkin, shuning uchun yaxshi sovutish tizimi va kuchli quvvat bloklari talab qilinadi.
💾 Katta hajmdagi kesh xotira, ray tracing va sun’iy intellekt uchun maxsus yadro (tensor) modullarning kuchayishi kutilyapti. Bu esa o‘yinlar va kreativ ilovalardagi ishlash tezligini sezilarli ravishda oshirishi mumkin.
➡️#nvidia | Birinchi raqamli IT-Blog
🔥🔥🔥 Mana, baliq!
💻 Insayder RTX 5090 haqidagi ma'lumotlarni sizdirdi. Unga ko'ra, 32 GB xotira, pik ishlash jarayonida 600 W quvvat sarfi va 512-bit,GDDR7 texnologiyasi asosida bo'larmish. Tabiiyki, RTX 4090 chetda choy ichadi.
ℹ️ RTX 5080 haqidagi ma'lumotlar esa 3-skrinda.
➡️#nvidia | Birinchi raqamli IT-Blog
🎂GeForce'ga 25 yil to'ldi!
ℹ️ 1999-yil 31-avgustda NVIDIA kompaniyasi GeForce 256 protsessorini taqdim etib, dunyodagi birinchi GPU'ga asos solgandi va shu orqali kompyuter texnologiyalari ichida revolyutsiyani amalga oshirgandi.
➡️#nvidia | Birinchi raqamli IT-Blog
💻 Nvidia o'zining sun'iy intellektini o'rgatish uchun millionlab YouTube videolarini yashirincha yuklab olayotgan ekan
😯 Demak, qanaqadir sensatsion loyiha tayyorlanmoqda. Nima bo'lishi mumkin?
➡️#nvidia | Birinchi raqamli IT-Blog
🖥NVIDIA endi kosmosning o‘zida data-markazlar qurishni boshlamoqda — birinchi sun’iy yo‘ldosh noyabr oyida uchiriladi.
🛰 Rejaga ko‘ra, orbital serverlar 4 km uzunlik va kenglikdagi ulkan quyosh panelidan quvvat oladi. Ular vakuumda sovutish jarayonini Yerda bo‘lgandek emas, ancha samarali amalga oshiradi — bu esa ulkan miqdordagi suvni tejash imkonini beradi.
🚀 Loyiha Starcloud nomli AQSh startapi bilan hamkorlikda olib borilmoqda, birinchi mijozlardan biri esa Google bo‘lgan. Ularning Gemma sun’iy intellekt modeli aynan shu kosmik serverda birinchi bo‘lib ishga tushiriladi.
🐚Bizning barcha loyihalar | #nvidia
⚡️Отличный ресурс, если хотите глубже понять, как работает параллельное исполнение на GPU.
Документация NVIDIA PTX раскрывает низкоуровневую модель выполнения: устройство команд, иерархию потоков, блоков, варпов, регистров и видов памяти.
Это базовый материал, без которого сложно разобраться, почему ядра GPU ведут себя именно так, как ведут, и как правильно писать высокопроизводительный код под CUDA.
Ссылка: https://docs.nvidia.com/cuda/parallel-thread-execution
@ai_machinelearning_big_data
#nvidia
🖥 NVIDIA опубликовали гайд: как масштабировать биологическиемодели.
Всё сводится к трём ключевым идеям:
1) Использовать Transformer Engine подменяет стандартные блоки на оптимизированные версии: меньше памяти, быстрее матричные операции, поддержка FP8/FP4. Это сразу увеличивает скорость обучения и инференса.
2) Масштабировать обучение до миллиардов параметров
Через FSDP и гибридные режимы параллелизма можно разнести модель по нескольким GPU или узлам. И главное, конфигурация уже готова, не нужно собирать всё вручную.
3) Экономить память за счёт sequence packing
Обычно биологические последовательности сильно различаются в длине, и половина батча забита паддингами. Packing позволяет «сжимать» батч, убирая пустые токены, итог: выше скорость, меньше VRAM.
Писать CUDA-ядра вручную никто не хочет. BioNeMo Recipes позволяют использовать привычный стек PyTorch + HuggingFace, но при этом получать производительность уровня «больших» фреймворков.
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/
@ai_machinelearning_big_data
#NVIDIA