Скорее всего уже слышали, что складывать строки через + это плохая практика. Падение производительности, и всё такое. Без лишних слов, давайте измерять:
from timeit import timeit
def t1():
# складываем 10 строк через + из переменной
t = 'text'
for _ in range(1000):
s = t + t + t + t + t + t + t + t + t
def t2():
# склеиваем список строк через метод join
arr = ['text'] * 10
for _ in range(1000):
s = ''.join(arr)
def t3():
# складываем через + но не из переменной а непосредственно инлайн объекты
for _ in range(1000):
s = 'text' + 'text' + 'text' + ... # всего 10 раз
Теперь каждую строку склейки запустим по 10М раз
>>> timeit(t1, number=10000)
0.21951690399964718
>>> timeit(t2, number=10000)
1.4978306379998685
>>> timeit(t3, number=10000)
0.2213820789993406
Хм, а нам говорили что через "+" это плохо и медленно ))) 😁
Тут стоит учитывать, что речь идёт о склейке множества длинных строк.
Давайте изменим условия:
def t4():
t = 'text'*100
for _ in range(1000):
s = t + t + t + t + t + t + t + t + t
def t5():
arr = ['text'*100] * 10
for _ in range(1000):
s = ''.join(arr)
def t6():
for _ in range(1000):
s = 'text'*100 + 'text'*100 + ... # всего 10 раз
>>> timeit(t4, number=10000)
12.795130728000004
>>> timeit(t5, number=10000)
2.642637542999182
>>> timeit(t6, number=10000)
0.2184546610005782
Вот, уже другой разговор, сразу видна разница, в среднем в 6 раз. Но погодите, почему последний тест t6() по скорости такой же как и t3()? Ведь строки теперь в 100 раз длиннее!
Это вопросы оптимизации кода, какие простые изменения ускоряют или замедляют выполнение программы. Мы столкнулись с примером обхода обращения к переменной. Например, именно так работает директива #define в С++, во время компиляции подставляя значение переменной вместо ссылки на неё.
В Python это тоже работает, но часто ли вы сможете встретить такой способ работы со строками? К сожалению, способ почти только теоретический.
В целом, тесты показали то, что мы хотели. Делаем выводы самостоятельно.
Полный листинг 🌍
#tricks
🥇NVIDIA RTX 5090 – "Dhahab Edition": oltin bilan qoplangan grafik karta Dubayda namoyish qilindi!
🖥 Bu oddiy RTX 5090 emas. Dubaydagi GITEX Africa 2025 ko‘rgazmasida taqdim etilgan karta 18 karatli 6.5 grammdan iborat haqiqiy oltin bilan bezatilgan bo‘lib, “Dhahab”(arabchada – oltin) deb nomlangan maxsus versiya.
✨ NVIDIA bu modelni o‘zi emas, balki Dubaydagi maxsus butik kompaniya orqali ishlab chiqargan. Dizaynidan tortib, qadoqlanishigacha – hammasi hashamatga yo‘g‘rilgan.
⚙️ Qanday texnik xususiyatlar borligi aytilmagan, ammo ehtimol oddiy RTX5090 bilan bir xil bo‘ladi. Faqat, ustiga NVIDIA Bosh direktori Jensen Xuangning dastxati ham tushirilgan.
🇦🇪 Bu karta kolleksionerlar va Dubaydagi premium texnologiya ishqibozlari uchun mo‘ljallangan.
🧐 Siz olarmidingiz bunday “oltin kartani”?
➡️#nvidia | Birinchi raqamli IT-Blog
💻NVIDIA GeForce RTX 5050: 8 GB GDDR6 xotira va 128-bit shina bilan ta'minlanadi
ℹ️ NVIDIA kompaniyasining yangi byudjet grafik protsessori — GeForce RTX 5050 haqida ma'lumotlar paydo bo'ldi. Ushbu model 8 GB GDDR6 videoxotira va 128-bit shina bilan jihozlanadi. Shuningdek, uning maksimal quvvat sarfi 130 W atrofida bo'lishi kutilmoqda.
⚙️ Ushbu xususiyatlar RTX 5050 modelini o'rta darajadagi grafik kartalar qatoriga qo'yadi. Uning raqobatchisi sifatida AMD RX 9070 modeli ko'rilmoqda. Ammo, to'liq texnik tafsilotlar va chiqarilish sanasi hali e'lon qilinmagan.
➡️#nvidia | Birinchi raqamli IT-Blog
🖥 PowerColor Radeon RX 9070 XT Red Devil: Yangi grafik karta uchun 900 W quvvat manbai talab qilinadi
ℹ️ Yaqinda tarqalgan ma'lumotlarga ko'ra, PowerColor Radeon RX 9070 XT Red Devil grafik kartasi uchun kamida 900 W quvvat manbai talab etiladi. Aytilishicha, unda 64 hisoblash bloklari va 3,0 GHz chastotada ishlovchi grafik protsessor, 3 ta 8-pinli quvvat ulagichi mavjud bo'ladi.
🆚 Taqqoslash uchun, PowerColor RX 9070 Reaper modeli uchun 650 W, RX 9070 XT Reaper uchun esa 750 W quvvat manbai kifoya qiladi.
➡️#nvidia | Birinchi raqamli IT-Blog
💻NVIDIARTX 5070 Ti rasmiy sotuv oldidan paydo bo‘ldi
⚙️ Asosiy xususiyatlar:
- 8960 CUDA yadrosi
- 16 GB GDDR7 xotira
- 256-bit shina kengligi
- 300 W energiya iste’moli
💸 Tavsiya etilgan narx — 749$, lekin ayrim Yevropa do‘konlarida 1300-1400 yevro atrofida sotilmoqda.
📅 Rasmiy sotuv 20-fevraldan boshlanishi kutilmoqda.
➡️#nvidia | Birinchi raqamli IT-Blog
💻Arzon mikrofon ovozini studiya darajasiga aylantiramiz — NVIDIA “Broadcast” dasturiga “Studio Voice” funksiyasini qo‘shdi.
ℹ️ Ishlatish juda oson — funksiyani yoqamiz va yozishni boshlaymiz. Natijada, toza va sifatli ovoz hosil bo‘ladi, qo‘shimcha sozlamalar kerak emas.
⬇️ Dasturni bepul yuklab oling: https://nvda.ws/4aKY2N6
➡️#nvidia | Birinchi raqamli IT-Blog
💻 RTX 5080 va RTX 5090 narxlari haqida ilk taxminlar
ℹ️ Yaqinda tarqalgan ma’lumotlarga ko‘ra, NVIDIA’ning keyingi avlod RTX 5080 va RTX 5090 grafik kartalari $899 va $1599 dan boshlanadigan narxlarda chiqishi mumkin. Bu hali rasmiy ma'lumot emas.
⚙️ Insayderlar ushbu avlod AD200 chip arxitekturasida ishlab chiqarilishini ta’kidlashmoqda. Energiya sarfi yuqori bo‘lishi mumkin, shuning uchun yaxshi sovutish tizimi va kuchli quvvat bloklari talab qilinadi.
💾 Katta hajmdagi kesh xotira, ray tracing va sun’iy intellekt uchun maxsus yadro (tensor) modullarning kuchayishi kutilyapti. Bu esa o‘yinlar va kreativ ilovalardagi ishlash tezligini sezilarli ravishda oshirishi mumkin.
➡️#nvidia | Birinchi raqamli IT-Blog
🔥🔥🔥 Mana, baliq!
💻 Insayder RTX 5090 haqidagi ma'lumotlarni sizdirdi. Unga ko'ra, 32 GB xotira, pik ishlash jarayonida 600 W quvvat sarfi va 512-bit,GDDR7 texnologiyasi asosida bo'larmish. Tabiiyki, RTX 4090 chetda choy ichadi.
ℹ️ RTX 5080 haqidagi ma'lumotlar esa 3-skrinda.
➡️#nvidia | Birinchi raqamli IT-Blog
🎂GeForce'ga 25 yil to'ldi!
ℹ️ 1999-yil 31-avgustda NVIDIA kompaniyasi GeForce 256 protsessorini taqdim etib, dunyodagi birinchi GPU'ga asos solgandi va shu orqali kompyuter texnologiyalari ichida revolyutsiyani amalga oshirgandi.
➡️#nvidia | Birinchi raqamli IT-Blog
💻 Nvidia o'zining sun'iy intellektini o'rgatish uchun millionlab YouTube videolarini yashirincha yuklab olayotgan ekan
😯 Demak, qanaqadir sensatsion loyiha tayyorlanmoqda. Nima bo'lishi mumkin?
➡️#nvidia | Birinchi raqamli IT-Blog
🖥NVIDIA endi kosmosning o‘zida data-markazlar qurishni boshlamoqda — birinchi sun’iy yo‘ldosh noyabr oyida uchiriladi.
🛰 Rejaga ko‘ra, orbital serverlar 4 km uzunlik va kenglikdagi ulkan quyosh panelidan quvvat oladi. Ular vakuumda sovutish jarayonini Yerda bo‘lgandek emas, ancha samarali amalga oshiradi — bu esa ulkan miqdordagi suvni tejash imkonini beradi.
🚀 Loyiha Starcloud nomli AQSh startapi bilan hamkorlikda olib borilmoqda, birinchi mijozlardan biri esa Google bo‘lgan. Ularning Gemma sun’iy intellekt modeli aynan shu kosmik serverda birinchi bo‘lib ishga tushiriladi.
🐚Bizning barcha loyihalar | #nvidia
⚡️Отличный ресурс, если хотите глубже понять, как работает параллельное исполнение на GPU.
Документация NVIDIA PTX раскрывает низкоуровневую модель выполнения: устройство команд, иерархию потоков, блоков, варпов, регистров и видов памяти.
Это базовый материал, без которого сложно разобраться, почему ядра GPU ведут себя именно так, как ведут, и как правильно писать высокопроизводительный код под CUDA.
Ссылка: https://docs.nvidia.com/cuda/parallel-thread-execution
@ai_machinelearning_big_data
#nvidia
🖥 NVIDIA опубликовали гайд: как масштабировать биологическиемодели.
Всё сводится к трём ключевым идеям:
1) Использовать Transformer Engine подменяет стандартные блоки на оптимизированные версии: меньше памяти, быстрее матричные операции, поддержка FP8/FP4. Это сразу увеличивает скорость обучения и инференса.
2) Масштабировать обучение до миллиардов параметров
Через FSDP и гибридные режимы параллелизма можно разнести модель по нескольким GPU или узлам. И главное, конфигурация уже готова, не нужно собирать всё вручную.
3) Экономить память за счёт sequence packing
Обычно биологические последовательности сильно различаются в длине, и половина батча забита паддингами. Packing позволяет «сжимать» батч, убирая пустые токены, итог: выше скорость, меньше VRAM.
Писать CUDA-ядра вручную никто не хочет. BioNeMo Recipes позволяют использовать привычный стек PyTorch + HuggingFace, но при этом получать производительность уровня «больших» фреймворков.
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/
@ai_machinelearning_big_data
#NVIDIA