TGTGInsighttelegram intelligenceLIVE / telegram public index
← Архипелаг БИГТЕХ
Архипелаг БИГТЕХ avatar

TGINSIGHT POST

Post #1861

@arhbigtech

Архипелаг БИГТЕХ

Прегледи8,380Број прегледа
Објављено13. јан13.01.2025. 10:17
Садржај

Садржај поста

🇸🇿Революция в ИИ: стоимость обучения продвинутых моделей упала с миллионов до сотен долларов Исследователи из лаборатории Sky Computing Lab Калифорнийского университета в Беркли совершили прорыв в области искусственного интеллекта, представив модель Sky-T1-32B-Preview с открытым исходным кодом. Главное достижение - беспрецедентное снижение стоимости обучения: всего $450 против миллионов долларов, которые ранее требовались для создания подобных моделей. Несмотря на низкую стоимость, Sky-T1 демонстрирует впечатляющие результаты, превосходя раннюю версию o1-preview от OpenAI по ряду важных показателей, включая тесты AIME, Math500 и LiveCodeBench. Модель создана на базе Qwen2.5-32B-Instruct с использованием синтетических данных, сгенерированных QwQ и обработанных с помощью o1-mini. Процесс обучения занимает всего 19 часов на восьми графических процессорах Nvidia H100, что делает технологию доступной практически для любого бизнеса. Разработчики опубликовали полные инструкции по воспроизведению модели, включая наборы данных и код для обучения. "Этот прорыв демонстрирует, что высокоуровневые возможности рассуждения теперь можно воспроизвести экономично и эффективно", - отмечает команда NovaSky ✈️«Архипелаг БИГТЕХ»