Post #1440

@DevOPSitsec

DevOps

Просмотры2,810Количество просмотров

Опубликован16 апр.16.04.2025, 18:01

Содержимое поста

Содержимое

🔥 ReZero — маленькая модель, которая никогда не сдаётся 🧠 ReZero — это LLM на базе Llama 3.2B, обученная не просто находить ответы, а упорно искать лучший. 🔁 Вместо того чтобы оптимизировать на скорость или recall, ReZero обучается пробовать снова и снова, пока не найдёт правильный ответ. Модель намеренно поощряется за настойчивость — если она делает retry и улучшает результат, это считается успехом. Использует синтетические поисковые движки, которые заставляют модель перезапрашивать и улучшать свои ответы. Обучается с помощью усиленного обучения (RL) — формируя привычку "не сдаваться". 🔜Github 🔜Модель @ai_machinelearning_big_data #LLM#Search#RL#AI#Meta#ReZero#NeverGiveUp#Llama3