TGTGInsighttelegram intelligenceLIVE / telegram public index
← Machinelearning
Machinelearning avatar

TGINSIGHT POST

Post #8747

@ai_machinelearning_big_data

Machinelearning

Views29,200Post view count
PostedOct 1310/13/2025, 10:49 AM
Post content

Post content

✔️Представлен новый метод для понимания работы больших языковых моделей — SAE Boost Метод помогает увидеть на какие внутренние признаки опирается ИИ, когда формирует ответы без переобучения всей модели. В основе — дополнительный автоэнкодер, который обучается на остаточной ошибке базовой модели и вылавливает редкие, специализированные сигналы, влияющие на решение модели. Sae Boost уже протестировали на тестах по химии, документах ООН и русскоязычном контенте – метод показал значительное улучшение качества реконструкции (explained variance) и снижения перекрестной энтропии LLM (LLM cross-entropy) на специализированных доменах. @ai_machinelearning_big_data #news#ai#ml#llm