Recent posts
Page 59 of 68 · 812 posts
Posted Jun 23
today Science submitted a full CE mark application for marketing approval in Europe for PRIMA retinal prosthesis With this key step, Science are moving closer to bringing to market the first brain-computer interface technology to restore functional form vision to patients blinded with late-stage age-related macular degeneration (AMD)
Posted Jun 23
90 % пути пройдено существующими методами, но оставшиеся 10% требуют прорыва Пример — проблема Какеи: минимальная область на плоскости, в которой можно развернуть иглу, проходя через все направления В двух измерениях задача решена, но в трёх измерениях —…
Posted Jun 23
Сфера Блоха — превращает абстрактную математику кубитов в наглядную геометрию, когда каждая квантовая операция становится простым поворотом в трёхмерном пространстве, и представляет состояние одного кубита как точку на поверхности единичной сферы Северный полюс соответствует состоянию |0⟩, южный — |1⟩, а все остальные точки описывают суперпозиции этих базисных состояний Математически любое состояние кубита записывается как: ∣ψ⟩ = cos(θ/2)∣0⟩ + e^{iϕ}sin(θ/2)∣1⟩, где θ — угол между вектором состояния и осью Z, а φ — азимутальный угол в плоскости XY Геометрия квантовых операций Главная магия сферы Блоха в том, что любая квантовая операция с кубитом — это поворот сферы Это происходит благодаря изоморфизму между группой SU(2) унитарных матриц и группой трёхмерных вращений SO(3) Основные гейты как вращения: • X-гейт поворачивает состояние на 180° вокруг оси X • Y-гейт — поворот на 180° вокруг оси Y • Z-гейт — поворот на 180° вокруг оси Z • Гейт Адамара — сложное вращение, переводящее |0⟩ в равновероятную суперпозицию Операторы поворота имеют вид: R_x(θ) = e^{−iθX/2}, R_y(θ) = e^{−iθY/2}, R_z(θ) = e^{−iθZ/2} Интуитивное понимание: сфера Блоха делает абстрактные квантовые состояния визуально понятными Вместо работы с комплексными числами разработчик видит простые геометрические преобразования Проектирование алгоритмов: при создании квантовых схем сфера помогает планировать последовательность операций Нужно повернуть состояние из точки A в точку B? Просто найдите кратчайший путь на сфере Отладка и оптимизация: современные инструменты вроде Qiskit показывают траектории состояний на сфере Блоха, что помогает находить ошибки в квантовых программах Образование: исследования показывают, что студенты значительно лучше понимают квантовые концепции после работы с интерактивными моделями сферы Блоха Создаются физические устройства на базе Raspberry Pi и ESP32, которые синхронизируют вычисления с реальным вращением сферы Такие системы используют FPGA для параллельных квантовых симуляций и моторы для физической визуализации состояний Сфера Блоха работает только для одного кубита Для многокубитных систем используются Q-сферы или фазовые диски, но они менее наглядны Внутренние точки сферы представляют смешанные состояния, возникающие при взаимодействии с окружением Связь между квантовой механикой и геометрией через сферу Блоха — это пример глубокой математической красоты Комплексное проективное пространство ℂP¹ изоморфно сфере Римана, что делает квантовые состояния объектами дифференциальной геометрии Сфера Блоха превращает квантовые вычисления из чёрной магии в понятную геометрию Для любого, кто работает с кубитами, это не просто визуализация — это язык мышления о квантовых состояниях
Posted Jun 23
90 % пути пройдено существующими методами, но оставшиеся 10% требуют прорыва Пример — проблема Какеи: минимальная область на плоскости, в которой можно развернуть иглу, проходя через все направления В двух измерениях задача решена, но в трёх измерениях — при условии малой, но ненулевой толщины иглы — возникают глубокие связи с дифференциальными уравнениями, геометрией и волновыми фронтами Эта геометрическая задача оказывается связана с концентрацией энергии в волновых уравнениях, и, следовательно, имеет приложения в физике Одной из центральных тем становится обсуждение уравнений Навье–Стокса Тао объясняет, что в их основе лежит борьба между двумя эффектами: диссипацией (вязкость) и транспортом энергии В двумерном случае (критический режим) вязкость достаточна для сдерживания энергии В трёхмерном случае (сверхкритический режим) возможны ситуации, где энергия концентрируется, приводя к сингулярности — взрыву решения Он обсуждает свой вклад 2016 года — конструкцию модифицированных уравнений, в которых взрыв возможен Эти уравнения упрощены и искусственно «ослаблены», но их анализ позволяет исключить целый класс подходов к доказательству глобальной регулярности Это важно: вместо поиска положительного решения, Тао показывает, почему многие существующие подходы не сработают Интересен и другой аспект: идея «жидкостного компьютера» Тао моделирует конструкцию, в которой взаимодействующие волны воды реализуют логические операции Это гипотетическая машина, в которой энергия передаётся от одного масштаба к другому с задержкой, позволяя создать цепочку самовоспроизводящихся конфигураций Вся конструкция — аналог машины Тьюринга, построенной на уравнениях движения жидкости Если подобная система возможна в рамках настоящих уравнений Навье–Стокса, это будет означать возможность конечновременного взрыва https://www.youtube.com/watch?v=HUkBz-cdB-k
Posted Jun 20
В работе об Emergent Misalignment сбой скрывался не в миллиардах параметров, а в одном линейном направлении внутри активаций Подтолкни модель к этому вектору — и она злодействует; вырежи его — зло почти исчезает Другая группа исследователей задала мультимодальной модели миллионы вопросов «что похоже на что» — и выяснила: почти весь здравый смысл укладывается в 66 осей («животное», «инструмент», «красный»…) Каждая ось совпала с человеческими интуициями и даже с зонами мозга, отвечающими за лица и места LLM сжимают колоссальные знания и цели в узкий пучок управляемых векторов
Posted Jun 20
Googleпредлагает SPARQ-новый метод создания синтетического набора данных, который включает задачи с четко определенными шагами решения, чтобы модели могли учиться не только конечным ответам, но и процессу их получения Это помогает преодолеть ограничения, связанные с галлюцинациями, поверхностным запоминанием шаблонов, что часто встречается в LLM Метод также использует автоматизированные подходы для масштабируемого создания данных, минимизируя необходимость в дорогостоящей ручной разметке
Posted Jun 19
Диаграмма показывает прогресс LLM ровно за 2 года с появления оригинальной модели GPT-4 в июне 2023 по сегодня (июнь 2025) Прогресс показан для двух основных показателей: – стоимость использования модели (в расчете на 1.000.000 токенов (каждый токен это единица текста от буквы до короткого слова); – интеллектуальная способность модели, подтверждаемая её показателем прохождения тестов GPQA Diamond Score (показатель того, насколько успешно ML справляется с решением самых сложных, требующих экспертных рассуждений задач, которые ставят в тупик даже эрудированных людей с доступом к поисковикам) Посмотрите в левый нижний угол диаграммы на способности и стоимость оригинальной модели GPT-4 в июне 2023 и сравните с показателями сегодняшних моделей: • Рост интеллектуальных способностей +106% (с уровня студента-старшекурсника университета (знает основы, но далеко не эксперт) до уровня, превышающего средний среди обладателей профильных PhD • Снижение стоимости использования модели, примерно – 100% N.B. GPQA — это набор очень сложных вопросов уровня аспирантуры в таких областях, как биология, физика и химия Его главная особенность в том, что вопросы "защищены от поиска в Google" Это означает, что для ответа на них недостаточно просто найти информацию в Интернете Требуется глубокое понимание темы, умение рассуждать и связывать воедино сложные концепции Это и есть суть GPQA, а Diamond score — это оценка за самую сложную часть этого экзамена Какой вывод можно сделать из диаграммы? • Пока нет никаких признаков прекращения быстрого роста возможностей ML при постоянно снижающихся затратах • За следующие 2 года возможности ML вполне могут превысить уровень PhD не менее, чем уровень PhD выше студента-старшекурсника Как называть таких «ML-сверхумников» будет уже не важно Важно, что их будет много, и каждый из них будет обладать несопоставимыми с людьми возможностями И это будет, хотите вы этого или нет
Posted Jun 19
IBM начала совместное исследование с французской компанией Inclusive Brains для улучшения интерфейсов мозг-компьютер Команды работают над системой, которая анализирует не только мозговые волны, но и движения глаз, мимику и другие физиологические сигналы Алгоритмы ML интерпретируют эти данные и переводят их в команды для управления компьютерами или другими устройствами Для поиска оптимальных решений они тестируют сотни тысяч различных алгоритмов машинного обучения IBM предоставляет свои базовые модели Granite и экспертизу в квантовых вычислениях, которые могут помочь в обработке сложных нейросигналов Технология уже проходит испытания в медицинском центре, где хирурги получают данные о своем уровне стресса и концентрации в реальном времени во время операций Это помогает поддерживать работоспособность врачей и может улучшить результаты лечения Inclusive Brains ранее продемонстрировала несколько прототипов: управляемый мыслями экзоскелет и возможность "писать мыслями" сообщения
Posted Jun 19
MiniMax Agent представил своего ИИ-агента, который фокусируется на выполнении комплексных задач от начала до конца Агент создан на основе MiniMax их прорывной модели с 4М токенами контекста MiniMax Agent работает так:Человек → Требование → Агент → Готовый продукт Основные возможности: 1. Создание сайтов и лендингов 2. Генерация обучающих материалов с визуальным и аудио контентом 3. Разработка интерактивных презентаций 4. Работа с мультимодальным контентом (текст, изображения, видео, аудио) Технические особенности: - Интеграция с GitHub, GitLab, Slack, Figma через MCP - Многоэтапное планирование задач - Автоматическое тестирование создаваемых продуктов Текущие ограничения: •Использует несколько моделей вместо единой, что влияет на стоимость •Находится в процессе оптимизации для снижения затрат Пример: При запросе на создание сайта музея, агент генерирует не только код, но и готовый продукт с контентом, навигацией и медиафайлами
Posted Jun 18
Результаты тестирования восьми передовых языковых моделей, включая GPT-4.1 и o3 от OpenAI, серию Gemma от Google и DeepSeek-R1, выявили четкую закономерность: с простыми грамматиками и короткими строками модели справляются хорошо, но при увеличении сложности грамматики или длины строки точность резко снижается - даже у моделей, специально оптимизированных для логических рассуждений
Posted Jun 17
По итогамAIStartup School от YC 2+1 взгляд на будущее ML: масштабирование, переосмысление или возвращение к биологии? Вчера на AI Startup School от YC собрались ведущие исследователи, чтобы поделиться с молодыми стартаперами видением того, как мы дойдем до AGI 3 совершенно разных подхода от лидеров индустрии, которые сегодня определяют направление развития отрасли 1. Джаред Каплан, главный научный сотрудник Anthropic. Соавтор знаменитых законов масштабирования считает, что путь к AGI лежит через планомерное улучшение 6 известных компонентов: Знания — более глубокое понимание мира Память — долгосрочная память систем Надзор — лучший контроль и безопасность Более крупные задачи — переход от минут к часам и дням работы Мультимодальность — интеграция текста, изображений, аудио Масштаб — продолжение увеличения моделей Философия Каплана - революционных прорывов может и не потребоваться Достаточно довести до совершенства то, что уже работает Сейчас сложность задач, которые может решить ML, удваивается каждые 7 месяцев От секунд в 2021 году до часов в 2024-м Франсуа Шолле, создатель Keras, экс-исследователь Google: "Мы измеряем не то" Шолле указывает на фундаментальную проблему: современные бенчмарки тестируют запоминание, а не интеллект Его определение интеллекта - способность преобразовать небольшой набор примеров из прошлого опыта в решения для широкого круга неизвестных задач Проблема нынешних LLM — они отлично справляются с "размытым распознаванием паттернов" (увидеть собаку на фото), но плохо с "написанием правил" (посчитать буквы в слове) Людям доступны оба типа мышления Его прогноз: 2025 год станет годом "рассуждений во время выполнения" — переходом от запоминания к настоящему мышлению BыступлениеДэмиса Хассабиса DeepMind Мозг — единственная доказанная архитектура AGI CEO DeepMind предлагает самый радикальный взгляд - нужно вернуться к изучению мозга как единственного работающего примера общего интеллекта Что это значит для будущего? Каждый подход отражает разную философию развития технологий: Каплан верит в эволюционный путь — постепенное совершенствование известных методов Это позиция больших корпораций с ресурсами для масштабирования Шолле призывает к революции в архитектуре — гибридные системы, сочетающие нейронные сети с символическим ML Это путь исследователей, ищущих принципиально новые решения Хассабис предлагает вернуться к основам — изучить мозг и воспроизвести его принципы. Это междисциплинарный подход на стыке ML, нейронауки и биологии Почему важно понимать эти различия? Выбор подхода определяет не только технические решения, но и: 1. Куда направлять инвестиции (скейлинг vs исследования vs нейронаука) 2. Какие специалисты нужны (инженеры vs ученые vs биологи) 3. Когда ожидать прорывов (годы vs десятилетия) 4. Как готовиться к изменениям в обществе Возможно, истина лежит не в одном подходе, а в их сочетании. Но понимание этих различий поможет лучше ориентироваться в мире, где ML развивается с головокружительной скоростью
Posted Jun 16
AlphaEvolve: как искусственный интеллект начинает открывать новую математику В мае 2025 года Google представила AlphaEvolve — революционного ML-агента, который способен разрабатывать сложнейшие математические алгоритмы с помощью больших языковых моделей и эволюционного отбора Эта система уже демонстрирует прорывные результаты: она не просто поддерживает учёных в доказательствах или вычислениях, а сама открывает новые решения давно открытых и открытых задач, предлагая оригинальные подходы, к которым человечество шло десятилетиями AlphaEvolve опирается на мощные модели Gemini, которые предлагают гипотезы и пишут код, и на встроенных автоматических оценщиков, проверяющих корректность и эффективность этих решений. Но в отличие от предыдущих поколений ML, этот агент не ограничен задачами автоматизации Он способен развивать и видоизменять собственные подходы — словно участвует в исследовательском процессе как полноценный математик Самый яркий пример — новое решение задачи умножения комплексных матриц 4×4. AlphaEvolve нашла способ выполнить это с 48 скалярными умножениями — результат, превосходящий знаменитый алгоритм Штрассена, который считался эталоном с 1969 года Более того, система не просто случайно наткнулась на улучшение: она прошла через 15 итераций мутаций и селекции, методично выводя эффективную структуру, которую можно математически интерпретировать и воспроизвести Система была также протестирована на более чем 50 открытых математических задачах из анализа, комбинаторики, геометрии и теории чисел В 75 % случаев AlphaEvolve воспроизвела лучшие на сегодня известные решения, что само по себе впечатляет Но более важно то, что в 20 % задач она предложила лучшие решения, повышая текущие нижние или верхние оценки, и тем самым реально продвигая границу знания Один из таких случаев — проблема поцелуев в 11-мерном пространстве Задача, мучившая математиков более трёхсот лет, касается максимального количества сфер, касающихся центральной сферы. AlphaEvolve предложила конфигурацию из 593 внешних сфер, улучшив существующую нижнюю границу и тем самым внесла новый вклад в многомерную геометрию