TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #9577

@ai_machinelearning_big_data

Machinelearning

Просмотры31,300Количество просмотров
Опубликован23 февр.23.02.2026, 08:03
Содержимое поста

Содержимое

📌Толковый калькулятор расчета инференса и дообучения LLM. Бесплатная тулза, которая помогает понять, какой GPU нужен под конкретную задачу до того как потрачен бюджет или наблюдается стойкий ООМ. Выбираете параметры инференса: архитектуру модели, тип квантования, sequence length и batch size, указываете спеки железа и получаете стату, распределение памяти, примерные метрики производительности и энергопотребления. Есть даже эмуляция скорости инференса с TTFT. Параметры расчета дообучения учитывают: конфиг датасета (количество сэмплов, среднее токенов на сэмпл, эпохи) и использование оптимизаторов. Плюс, еще посчитает время обучения. Цифры часто получаются чуть выше реального потребления (что даже хорошо), но точности до гигабайта ждать не стоит. Для грубой прикидки перед закупкой или деплоем - отличная вещь. @ai_machinelearning_big_data #AI#ML#LLM#VRAMCalculator