TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
Post content
Возможно скоро грядет новая версия Kimi-K2-0905, судя по немного спекулятивному обсуждению на реддите. А мы только на днях добавим на ребенч первую версию, которая, кстати, очень неплохо себя показывает 🤯 Уверен, что новая модель залетит в топ на большинстве агентских кодовых бенчей, но здесь мне интереснее другой факт. По-моему, Kimi были чуть ли не первыми, кто в работе по большим претренам рассказал, что учил в конце RL не только на верифицируемые задачи, но и на неверифицируемые с помощью рубрик. И очень интересно посмотреть, во что это выльется на бенчах по типу Creative Writing, особенно учитывая их сообщения в дискорде.