Post #6

@MachineLearningResearch

AML

Views22Post view count

PostedApr 2504/25/2025, 12:02 PM

Post content

GPT и Gemini оценивают научный доклад уже после 15–60 слов — и попадают в точку До сих пор сверхвозможности больших языковых моделей мы видели в «текстовом океане» — когда нужно осмыслить миллиарды слов Новая работа Michigan State University показала, что те же модели не менее точны в микромире: по первым двум-трем предложениям (≈ 1-5 % текста, меньше полуминуты речи) они с корреляцией 0.7 предсказывают, как доклад оценят живые эксперты Иными словами, ML выхватывает те самые сигналы, по которым мы подсознательно решаем: «слушать дальше или переключиться» Это приближает к эмпирической проверке популярного «7-second rule» Роджера Айлза (авторы уточняют: точное число секунд условно) - популярный постулат о публичных выступлениях, ораторском мастерстве и деловом общении: «Слушатели (или собеседники) составляют первичное и часто стойкое мнение о спикере за первые семь секунд после его появления» Эти семь секунд включают момент выхода на сцену, первые слова, мимику, контакт глаз, позу и темп голоса - т.е. касаются в основном невербальной коммуникации Авторы новой работы перенесли этот подход на вербальную коммуникацию, опираясь прежде всего на классическую «тонко-ломтевую» (thin-slice) линию исследований, начатую в 1990-е Натали Амбади и Робертом Розенталем (их эксперименты показали, что по 30-секундным беззвучным отрывкам можно с высокой точностью предсказывать оценки преподавателей студентами) С тех пор на основе “тонких срезов” вырос целый корпус работ. Например: • «speed-dating»: по нескольким секундам общения оценивали перспективу отношений • микроданные невербального поведения на собеседованиях • сигналы эмоций через невербальные каналы • восприятие харизмы только по голосу (и шире - по акустике речи) • мгновенные решения о доверии и компетентности по выражению лица • как впечатления о спикере влияют на восприятие самого контента Всё это - фундамент доказательства, что крошечные отрывки поведения и речи несут достаточную информацию о навыках, эмоциях и чертах личности Но лишь революция ChatGPT позволила применить подобный подход в языково-текстовом микромире (где нет ни голоса, ни внешности, а есть только стенограмма) Как это делали: • 128 докладов, • 2 модели GPT-4o-mini и Gemini 1.5 • срезы размером 1-75 % текста стенограмм • оценки моделей сравнивали с 60 экспертами - людьми Что из этого следует для нас? Золотое правило «зацепи аудиторию в первую минуту» получило эмпирическое подтверждение: если первые фразы скучны, дальше уже поздно спасать ситуацию LLM открывают дорогу к молниеносной, практически бесплатной обратной связи для преподавателей, политиков, учёных и всех, кому важно говорить убедительно Соединяя идеи «тонких срезов» и возможности ML, мы получаем масштабируемый, надёжный и валидный инструмент, который поможет прокачивать публичные выступления и доводить их восприятие аудиторией до максимума (в пределах харизмы спикера) Cкоро к LLM-анализу «тонких срезов» стенограмм добавится анализ тонких срезов аудио и видео выступлений (т.е. мультимедийный синтез всех каналов вербальной и невербальной коммуникации) И тогда ML станет незаменимым инструментом для политтехнологов, спичрайтеров и имиджмейкеров А уж из совсем крышесносных перспектив - преодоление несжимаемости эволюционного опыта Homo sapiens