Post content
Apple протестировала современные «рассуждающие» ИИ, такие как Claude + DeepSeek, которые выглядят умными, но при повышении сложности они разрушаются Не изящно разрушаются Они полностью разрушаются LLM не масштабируют рассуждения, как это делают люди Они думают БОЛЬШЕ до определенного момента... Потом они сдаются, даже когда у них остается много вычислительных ресурсов Даже получив алгоритм, LLM все равно не справляются с заданием Выполнение ≠ понимание Это не «отсутствие креативности» - это неспособность к базовой логике Модели «переосмысливают» ЛЕГКИЕ задачи - ищут НЕПРАВИЛЬНЫЕ ответы после того, как нашли ПРАВИЛЬНЫЙ А когда проблемы становятся сложнее... они думают меньше Потраченные впустую вычисления на одном конце - пораженчество на другом Apple считает, что эти модели НЕ рассуждают Они - супердорогие программы для сопоставления шаблонов, которые ломаются, как только мы выходим за рамки их обучающего распределения https://machinelearning.apple.com/research/illusion-of-thinking