Садржај поста
🇸🇿Революция в ИИ: стоимость обучения продвинутых моделей упала с миллионов до сотен долларов Исследователи из лаборатории Sky Computing Lab Калифорнийского университета в Беркли совершили прорыв в области искусственного интеллекта, представив модель Sky-T1-32B-Preview с открытым исходным кодом. Главное достижение - беспрецедентное снижение стоимости обучения: всего $450 против миллионов долларов, которые ранее требовались для создания подобных моделей. Несмотря на низкую стоимость, Sky-T1 демонстрирует впечатляющие результаты, превосходя раннюю версию o1-preview от OpenAI по ряду важных показателей, включая тесты AIME, Math500 и LiveCodeBench. Модель создана на базе Qwen2.5-32B-Instruct с использованием синтетических данных, сгенерированных QwQ и обработанных с помощью o1-mini. Процесс обучения занимает всего 19 часов на восьми графических процессорах Nvidia H100, что делает технологию доступной практически для любого бизнеса. Разработчики опубликовали полные инструкции по воспроизведению модели, включая наборы данных и код для обучения. "Этот прорыв демонстрирует, что высокоуровневые возможности рассуждения теперь можно воспроизвести экономично и эффективно", - отмечает команда NovaSky ✈️«Архипелаг БИГТЕХ»