Содержимое
На T-Pro 2.0 мы потратили всего 120 млн ₽ В эту сумму входит всё: пол-года R&D, удачные и неудачные запуски обучения, стоимость датасетов. Для моделей такого уровня это очень скромно и эффективно. Финальный прогон – 2.6 млн ₽. Большая разница – норма: нужна широкая сетка экспериментов, чтобы подобрать подход, датамикс и параметры. Для сравнения: стоимость финального прогона для GPT-4 оценивается примерно в $40 млн (~3 млрд ₽). Да, в 1000 раз больше 😳 Яндекс ещё в 2023 тратил на генеративки больше 10 млрд/год; у Сбера масштабы ещё больше. Конечно, мы не обучаем модели с нуля. Чтобы мы уложились в 120 млн, Alibaba сожгла миллиарды. Но какой смысл обучать с нуля? Теперь вы можете взять наши запакованные в T-Pro 120 млн и строить своё – ещё дешевле 🌟