TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
HugginFace выпустил практический курс по дообучению (fine-tuning) LLM — как из базовой модели сделать полезного ассистента и довести его до качества, которое видно на лидерборде. Он шаг за шагом учит инструкционному тюнингу (SFT), оценке, выравниванию по предпочтениям (DPO) и RL, плюс затрагивает мультимодальные (VLM) и синтетические данные. https://huggingface.co/learn/smol-course/