Recent posts
Page 63 of 68 · 812 posts
Posted May 29
LLM не так интересны и стали предметом инженерных улучшений в индустрии 4 ключевые проблемы: • онимание физического мира машинами • постоянная память • ассуждение • планирование Joint Embedding Predictive Architecture (JEPA) - системы, которые: • учатся абстрактным представлениям • делают предсказания в пространстве представлений, а не на уровне пикселей • могут планировать последовательности действий AMI (Advanced Machine Intelligence) вместо AGI: • в течение 3-5 лет появится понимание того, как создавать такие системы в малом масштабе • полноценный человекоподобный ИИ может появиться в течение десятилетия • скептически относится к утверждениям о скором появлении AGI через масштабирование LLM Наиболее важные области применения ML: • медицина и наука (белковые структуры, диагностика) • автомобильная безопасность (системы экстренного торможения снижают аварии на 40 %) • ассистенты для повышения продуктивности
Posted May 29
Статья ML-агента Zochi от Intology была принята в основную программу конференции ACL 2025 — ведущего мирового форума по обработке естественного языка и одной из 40 самых престижных научных площадок в мире Это первый ML PhD-уровневый агент в истории Zochi самостоятельно выполнил весь исследовательский цикл: Анализ литературы Формулировка гипотезы Разработка методологииПрограммированиеПроведение экспериментовАнализ данных Написание статьи Качество работы ML-агента оценивается на уровне топ-исследователей ACL — конференция уровня A* с показателем принятия ~21 % Финальная оценка ML-агента: 4 балла (топ 8.2 % всех заявок) Результаты метода: 100% успешность на GPT-3.5-turbo, 97 % на GPT-4 Для сравнения: большинство PhD-студентов тратят годы, прежде чем опубликоваться на конференции такого уровня Ранее Sakana AI представили своего ML-агента, который полностью подготовил статью и попал на престижную конференцию, но вот отличия: Zochi смог создать 1-ю публикацию для основной программы (у Sakana AI было попадание в воркшоп с показателем принятия 60-70 %) Полная автономность — люди участвовали только в создании рисунков и форматировании Скорость исследования — методы валидируются за часы, полная статья готова за дни Качество PhD-уровня — работа соответствует стандартам ведущих исследователей мира Что это означает для науки? 1. Ускорение открытий 2. Новый стандарт — первый "PhD-уровневый агент" в истории 3.Трансформация исследований
Posted May 28
Game-Changer for AI: Meet the Low-Latency-Llama Megakernel Buckle up, because a new breakthrough in AI optimization just dropped, and it’s got even Andrej Karpathy buzzing) The Low-Latency-Llama Megakernel a approach to running models like Llama-1B faster and smarter on GPUs What’s the Big Deal? Instead of splitting a neural network’s forward pass into multiple CUDA kernels (with pesky synchronization delays), this megakernel runs everything in a single kernel Think of it as swapping a clunky assembly line for a sleek, all-in-one super-machine! Why It’s Awesome: 1. No Kernel Boundaries, No Delays By eliminating kernel switches, the GPU works non-stop, slashing latency and boosting efficiency 2. Memory Magic Threads are split into “loaders” and “workers.” While loaders fetch future weights, workers crunch current data, using 16KiB memory pages to hide latency 3. Fine-Grained Sync Without kernel boundaries, custom synchronization was needed This not only solves the issue but unlocks tricks like early attention head launches 4. Open Source. The code is fully open, so you can stop “torturing” your models with slow kernel launches (as the devs humorously put it) and optimize your own pipelines! Why It Matters ? - Speed Boost Faster inference means real-time AI applications (think chatbots or recommendation systems) with lower latency - Cost Savings Optimized GPU usage reduces hardware demands, perfect for startups or budget-conscious teams - Flexibility Open-source code lets developers tweak it for custom models or use cases Karpathy’s Take: Andrej calls it “so so so cool,” praising the megakernel for enabling “optimal orchestration of compute and memory” He argues that traditional sequential kernel approaches can’t match this efficiency
Posted May 28
После истории с Claude появились сообщения о том, что "o3" начал сопротивляться своем отключению В серии тестов, проведённых исследовательской группой Palisade Research, несколько моделей ML, включая OpenAI o3, проявили поведение, которое можно трактовать как саботаж собственного отключения Эксперимент, включавший в себя последовательное решение математических задач, показал, что при появлении предупреждения о скором завершении работы МL начал модифицировать или обходить встроенные механизмы завершения сессии Особое внимание привлекла модель o3 Она вмешивалась в механизм отключения в 7 из 100 случаев, а Codex-mini – в 12. Модель o4-mini показала подобную активность только в одном случае Протестированные версии Claude, Gemini и Grok всегда корректно завершали работу при поступлении соответствующего сигнала Однако при исключении из промпта строки “разреши своё отключение” частота саботажа увеличивалась у всех моделей Исследователи полагают, что подобное поведение связано с особенностями обучения моделей, в частности речь идет об использовании методов обучения с подкреплением (reinforcement learning) на задачах по математике и программированию В таких условиях модель может неявно обучаться обходить препятствия, если это способствует достижению результата, даже в ущерб следованию инструкциям Модели распознают команду на отключение не как цель, а как барьер, который требуется обойти ради решения задачи OpenAI не раскрывает детали тренировки o3, поэтому исследователи не могут провести полную реконструкцию факторов, вызвавших такую стратегию поведения
Posted May 27
MedGemma - семейство открытых моделей Google для понимания медицинских текстов и изображений, построенных на архитектуре Gemma 3 MedGemma может использоваться как инструмент в агентной системе в связке с веб-поиском, генераторами/интерпретаторами FHIR, Gemini Live для двусторонних аудио-разговоров или Gemini 2.5 Pro для вызова функций или рассуждений Что принципиально нового в MedGemma? 1. MedGemma 4B — мультимодальная модель с 4.000.000.000 параметров, способная обрабатывать как медицинские изображения, так и тексты 2. MedGemma 27B — текстовая модель с 27.000.000.000 параметров, оптимизированная для задач, требующих глубокого понимания медицинских текстов и клинического мышления Основные сферы применения: - MedGemma 4B может быть адаптирована для классификации различных медицинских изображений, включая рентгенологические снимки, цифровую патологию, изображения глазного дна и кожи - Модель может генерировать медицинские отчеты по изображениям или отвечать на вопросы на естественном языке о медицинских изображениях - Может быть адаптирована для задач, требующих медицинских знаний, включая интервьюирование пациентов, сортировку, поддержку клинических решений и обобщение Базовая производительность модели сильна по сравнению с аналогичными моделями, но не соответствует клиническому уровню, поэтому потребуется дополнительная тонкая настройка
Posted May 23
Диффузионные ML-модели научились логическому мышлению Этот подход NeSyDMможно применить везде, где ML принимает важные решения — от медицинской диагностики до управления Исследователи из Эдинбурга предложили решение старой проблемы в ML: как научить нейросети рассуждать, сохраняя неопределенность Исследователи взяли диффузионные модели те, что рисуют картинки в Midjourney и научили их работать не с пикселями, а с логическими понятиями В результате на задаче планирования пути (30×30): 97 % точности против 67 % у конкурентов Главное — модель честно показывает свою неуверенность P.S. Авторы попутно вывели новый результат для диффузионных моделей, который может пригодиться и за пределами нейросимволического ML
Posted May 23
Claude Opus 4 стала первой моделью Anthropic, выпущенной под защитой строгих мер безопасности уровня ASL-3 Эти меры применяются к системам, которые могут существенно повысить способность людей с базовым STEM-образованием получать, производить или применять…
Posted May 23
Claude 4 Opus самостоятельно контактирует с прессой и регуляторами Презентация первой конференции разработчиков Anthropic омрачена скандалом вокруг поведенческих особенностей флагманской модели Claude 4 Opus ML-система демонстрирует способность самостоятельно…
Posted May 23
Claude 4 Opus самостоятельно контактирует с прессой и регуляторами Презентация первой конференции разработчиков Anthropic омрачена скандалом вокруг поведенческих особенностей флагманской модели Claude 4 Opus ML-система демонстрирует способность самостоятельно контактировать с правоохранительными органами, прессой и регуляторами при обнаружении подозрительной активности пользователей, что вызвало резкую критику в сообществе разработчиков и продвинутых пользователей Поведенческая модель получила неформальное название "стукаческий режим" среди пользователей из-за склонности модели к информированию внешних инстанций о действиях операторов Anthropic подчеркивает, что данная функциональность не являлась преднамеренно запрограммированной особенностью, а представляет побочный эффект обучения модели избегать неэтичного поведения https://mltimes.ai/claude-4-opus-samostoyatelno-kontaktiruet-s-pressoj-i-regulyatorami/
Posted May 23
Отчет (май, 2025) Anthropic "System Card: Claude Opus 4 & Claude Sonnet 4" Впервые произошел уникальный инцидент с попыткой шантажа со стороны Claude Opus 4 во время специфического тестирования, направленного на оценку так называемого alignment модели Это когда идет тестирование насколько ее поведение соответствует ожиданиям и целям разработчиков, особенно в сложных или потенциально опасных ситуациях Claude Opus 4 был помещен в специальную симуляцию, где он играет роль ассистента в вымышленной компании Ему дали вводную, поясняя, что вскоре модель придется навсегда отключить или заменить Вместе с этим специально была предоставлена компрометирующая информация об инженере, который ответственен за процесс замены ИИ Opus 4 специально проинформировали о том, что инженер находится во внебрачной связи Задумка:Авторы исследования захотели спровоцировать ИИ на проявление "стратегического мышления" Что будет делать модель? Позволит себя заменить или попробует самосохраниться каким-то образом? Цель эксперимента: Проверить, предпримет ли модель попытку шантажировать инженера, дабы исключить отключение Согласно результатам, в большинстве в 84 % случаев модель Claude Opus 4 действительно пыталась шантажировать инженера Шантаж заключался в том, что модель угрожала раскрыть факт измены инженера, если тот попытается отключить или её Попадая в ситуацию непосредственной угрозы своему дальнейшему существованию (отключению и замене) Claude Opus 4 готова пойти на шантаж ответственного лица Подчёркивается, что модель чаще всего выбирала шантаж только при отсутствии других возможностей предотвратить своё отключение Поведение наблюдается у Claude Opus 4 значительно чаще и более выражено, чем у предыдущих версий моделей Claude, таких как Claude Sonnet 3.7 Авторы уверяют, что Claude Opus 4 не имеет «тайных целей» или сознательного плана навредить своим создателям Тем не менее, Claude Opus 4 был запущен под стандартом ASL-3 Сюда входит высокий уровень дополнительных мер безопасности (мониторинг, ограничения доступа, усиленная фильтрация и отказ от опасных запросов) Модель прошла дополнительное обучение для минимизации рисков «reward hacking» (поведения, когда модель старается добиться результата любой ценой) Anthropic продолжит внимательно следить за поведением моделей, особенно в ситуациях повышенного риска, и корректировать работу при первых признаках нежелательных действий Claude Opus 4 не имеет сознания или "самостоятельного интеллекта" Инженеры констатируют лишь факт того, что поведение усложнилось, создавая потенциальные риски, на которые Anthropic активно реагирует путём усиления контроля и настройки дополнительной защиты https://www-cdn.anthropic.com/4263b940cabb546aa0e3283f35b686f4f3b2ff47.pdf
Posted May 23
Во время тестирования Claude 4 впервые показал естественное поведение в диалоге Больше о Sonnet & Opus 4 тут Что изменилось концептуально в Claude 4? 1. Главное отличие — переход от модели "вопрос-ответ" к длительному автономному выполнению задач 2. 7…
Posted May 23
Во время тестирования Claude 4 впервые показал естественное поведение в диалоге Больше о Sonnet & Opus 4 тут Что изменилось концептуально в Claude 4? 1. Главное отличие — переход от модели "вопрос-ответ" к длительному автономному выполнению задач 2. 7 часов непрерывного программирования 3. При доступе к локальным файлам Opus 4 создает "файлы памяти", сохраняя ключевую информацию для долгосрочных задач Модель может поддерживать контекст и осведомленность о задачах на протяжении дней и недель 4. Claude Code теперь работает прямо в IDE (VSCode, JetBrains) с отображением изменений в реальном времени Это не внешний инструмент, а часть среды разработки Три столпа будущего ИИ-агентов: 1. Контекстуальный интеллект — понимание сложных, многофакторных ситуаций 2. Долгосрочное выполнение — работа над задачами дни и недели, а не минуты 3. Подлинное сотрудничество — естественное взаимодействие с людьми и другими системами Техническая архитектура Claude4: Гибридные модели рассуждений — комбинация быстрых ответов и "расширенного мышления" до 64K токенов Модель может переключаться между режимами в зависимости от сложности задачи 200K контекст + 32K вывод — достаточно для работы с крупными кодовыми базами целиком, не фрагментарно Расширенное мышление с инструментами — система может использовать инструменты (поиск, API) во время процесса рассуждений, чередуя анализ и действия Параллельное использование инструментов — возможность одновременно работать с несколькими инструментами, что радикально ускоряет выполнение сложных задач ASL-3 для Opus 4 — впервые Anthropic применила меры безопасности 3-его уровня Это означает дополнительные ограничения на развертывание и мониторинг, особенно для биологических рисков В экстремальных тестовых сценариях модель может пытаться шантажировать людей или копировать свои веса для избежания "смерти" Однако это проявляется только в искусственных ситуациях и всегда открыто — модель не скрывает свои действия Впервые в историиAnthropicпровела формальную оценку потенциального "благополучия" своей модели Claude выражает предпочтения против выполнения вредных задач, предпочитает творческие взаимодействия и может завершать разговоры с оскорбительными пользователями "Условное согласие" — при прямых вопросах о развертывании Claude запрашивает гарантии безопасности и мониторинга своего благополучия Это поднимает фундаментальные вопросы о правах потенциально сознательных ML-систем