Содержимое
TRIBE v2 — это три-модальная основная модель (видео, аудио и язык), созданная для in-silico нейронауки. Обученная на более чем 1000 часах fMRI-данных от 720 испытуемых, модель точно предсказывает активность человеческого мозга в самых разных естественных и экспериментальных условиях — значительно превосходя традиционные линейные модели кодирования. TRIBE v2 хорошо обобщается на новые стимулы, задачи и даже новых людей. Она позволяет проводить полноценные виртуальные эксперименты in silico: модель успешно воспроизводит ключевые результаты десятилетий исследований в области зрительного восприятия и нейролингвистики. Кроме того, благодаря извлечению интерпретируемых латентных признаков, она раскрывает тонкую топографию мультисенсорной интеграции в мозге. Таким образом, искусственный интеллект становится unifying framework для изучения функциональной организации человеческого мозга. https://ai.meta.com/research/publications/a-foundation-model-of-vision-audition-and-language-for-in-silico-neuroscience/