TGTGInsighttelegram intelligenceLIVE / telegram public index
Back to channels
AML avatar

TGINSIGHT CHAT

AML

@MachineLearningResearch

Technologies

ALGORITHMS MACHINE LEARNING

Subscribers136Current channel subscribers
Tracked posts812Indexed post count
Recent reach266Sum of recent post views
Recent posts

Recent posts

Page 67 of 68 · 812 posts

Posted May 1

«This book is intended to give a serious and reasonably complete introduction to algebraic geometry, not just for (future) experts in the field (…) For a number of reasons, algebraic geometry has earned a reputation of being inaccessible The power of the subject comes from rather abstract heavy machinery, and it is easy to lose sight of the intuitive nature of the objects and methods. (…) But there is another more optimistic perspective to be taken The ideas that allow algebraic geometry to connect several parts of mathematics are fundamental, and well-motivated Many people in nearby fields would find it useful to develop a working knowledge of the foundations of the subject, and not just at a superficial level (…) The rough edges of scheme theory have been sanded down over the past half century, although there remains an inescapable need to understand the subject on its own terms» «…in an ideal world, people would learn this material over many years, after having background courses in commutative algebra, algebraic topology, differential geometry, complex analysis, homological algebra, number theory, and French literature We do not live in an ideal world For this reason, the book is written as a first introduction, but a challenging one» https://math.stanford.edu/~vakil/216blog/FOAGsep0824public.pdf

27 views

Posted May 1

Статья в Нейче по результатам сопоставления теорий сознания Тонони (IIT) и Деана (GNWT) Напомним, что в первой публикации по состязательному экспериментальному сопоставлению "нейротеорий сознания" были найдены слишком грубые нарушения нормальных исследовательских практик Кроме того, я не уверен, что используемый методический подход — околопороговые стимулы — вообще дает возможность отделять сознание от неспецифичных для него механизмов (зато он чреват всякими методическими проблемами, что можно было ранее наблюдать и в исследованиях того же Станислава Деана) Cтатья может быть полезной как минимум с точки зрения подробно документированной демонстрации ограниченности возможностей нынешних популярных "нейротеорий сознания" Вот полная ссылка: Cogitate Consortium, Oscar Ferrante, Urszula Gorska-Klimowska, Simon Henin, Rony Hirschhorn, Aya Khalaf, Alex Lepauvre, Ling Liu, David Richter, Yamil Vidal, Niccolò Bonacchi, Tanya Brown, Praveen Sripad, Marcelo Armendariz, Katarina Bendtz, Tara Ghafari, Dorottya Hetenyi, Jay Jeschke, Csaba Kozma, David R. Mazumder, Stephanie Montenegro, Alia Seedat, Abdelrahman Sharafeldin, Shujun Yang, Sylvain Baillet, David J. Chalmers, Radoslaw M. Cichy, Francis Fallon, Theofanis I. Panagiotaropoulos, Hal Blumenfeld, Floris P. de Lange, Sasha Devore, Ole Jensen, Gabriel Kreiman, Huan Luo, Melanie Boly, Stanislas Dehaene, Christof Koch, Giulio Tononi, Michael Pitts, Liad Mudrik & Lucia Melloni. Adversarial testing of global neuronal workspace and integrated information theories of consciousness. Nature, 30 April 2025 https://www.nature.com/articles/s41586-025-08888-1 https://doi.org/10.1038/s41586-025-08888-1 (Open Access) Сравнивались предсказания теории интегрированной инфорации (IIT) и теории глобального нейронального рабочего пространства (GNWT) Исследователи — сторонники каждой из теорий и теоретически-нейтральный консорсциум 256 испытуемым предъявлялись надпороговые стимулы Регистрировались фМРТ, МЭГ, ЭКоГ Были выявлены активации различных областей мозга, паттерны которых согласуются с некоторыми предсказаниями IIT и GNWT, однако бросают вызов ключевым положениям обеих теорий ("Для IIT отсутствие устойчивой синхронизации в задней коре противоречит утверждению, что сетевая связность определяет сознание. GNWT оспаривается общим отсутствием зажигания при смещении стимула и ограниченной представленностью определенных размерностей сознания в префронтальной коре") Также предлагаются некоторые общеметодологические соображения о том, как вообще развивать когнитивные нейронауки

25 views

Posted Apr 30

Группа исследователей выпустила статью, в которой разоблачает системные проблемы популярного рейтинга Chatbot Arena Оказывается, вместо честной гонки, мы видим манипуляции и неравные условия Почему это важно? Chatbot Arena влияет на исследования, инвестиции и восприятие ML Но вместо реального прогресса мы видим, как крупные игроки эксплуатируют лазейки, усиливая свое доминирование Это бьет по открытым проектам и тормозит инновации Вот, что важно знать: Ключевые проблемы: 1. Привилегии для гигантов: OpenAI, Google, Meta* и Anthropic тестируют десятки приватных моделей (например, Meta — 27 вариантов Llama 4) и публикуют только лучшие результаты, завышая свои позиции 62.8 % тестовых запросов идут четырем крупным компаниям, а 83 открытым моделям — всего 29.7 % Данные Arena дают до 112 % прироста в тестах, но доступ к ним ограничен для небольших команд 205 из 243 моделей (66 % открытых) были незаметно убраны из рейтинга без объяснений Проприетарные модели исключают реже Разная частота тестов, скрытые правила и отсутствие публичности результатов создают иллюзию объективности Arena уже признала некоторые проблемы, но утверждает, что они не являются результатом фундаментальных изъянов в дизайне платформы Они заявили, что обновили свои правила, чтобы "усилить приверженность справедливым и воспроизводимым оценкам" Реакция сообщества: - На X и Reddit разработчики жалуются: их модели получают меньше запросов и чаще исключаются - Есть призывы к бойкоту Arena и переходу на Hugging Face Open LLM Leaderboard - Есть идеи о децентрализованных платформах, где данные распределяются равномерно, но они пока в зачатке Что предлагают авторы статьи? - Прозрачность: публиковать все результаты тестов - Равные правила: ограничить число приватных вариантов и справедливо распределять запросы - Честное исключение: уведомлять разработчиков и не дискриминировать открытые модели

21 views

Posted Apr 30

В журнале «Монокль» сегодня опубликована разумная статья, в которой весьма скептически оценивается польза инструментов искусственного интеллекта (ИИ), основанных на больших языковых моделях (типа ChatGPT) для решения «приземленных прикладных задач конкретного бизнеса с учетом его специфики»: https://monocle.ru/monocle/2025/18/chatgpt-a-chto-v-sukhom-ostatke/ Согласен с основным тезисом, вынесенным в подзаголовок статьи: «То, что мы называем сегодня искусственным интеллектом, пока не более чем новый формат поисковой системы в интернете» Польза от подобных инструментов ML для научных исследований весьма ограничена Прежде всего потому, что ML не способен к критическому мышлению, которое лежит в основе любого научного поиска И, в любом случае, все то, что предлагают эти инструменты, надо самостоятельно перепроверять; в науке искусственный интеллект без естественного не работает Особо хотел бы обратить внимание на следующий фрагмент статьи в «Монокле»: Писать дипломы ИИ умеет Сейчас многие учащиеся техникумов и вузов пользуются нейросетью ради экономии времени и сил Но при этом создается огромное количество бесполезных работ — примитивной компиляции найденного в интернете материала Завтра такие дипломы снова попадут в интернет, на них обучатся новые чат-боты, и совсем скоро Всемирная паутина окажется набита бессмысленными псевдонаучными текстами, в которых просто переставлены абзацы и заменены синонимы Как тут не вспомнить прошлогоднюю статью в Nature, в которой показано как инструменты ИИ на основе больших языковых моделей быстро деградируют (в плане качества выдаваемых текстов), если обучение нейросети происходит на текстах, генерируемых самой этой нейросетью Девяти поколений применения такой процедуры достаточно, чтобы вместо осмысленного текста нейросеть начала выдавать полную «тарабарщину»: https://www.nature.com/articles/s41586-024-07566-y Совсем недавно появилось забавное подтверждение этих соображений из сферы научных исследований Уже в 22 научных статьях вдруг появился бессмысленный термин «вегетативная электронная микроскопия»: https://naukatv.ru/news/strannaya_fraza_postoyanno_vstrechaetsya_v_nauchnykh_statyakh_no_pochemu Есть две гипотезы того, как такой термин мог попасть в интернет: либо это произошло из-за ошибки сканирования старого научного журнала 1950-х годов, либо ошибка возникла из-за автоматического перевода написанных на фарси иранских научных работ – в этом языке слова «вегетативный» и «сканирующий» отличаются всего одной точкой Но безусловный факт состоит в том, что ChatGPT «узаконил» этот термин, и стал его использовать в выдачах сгенерированных текстов А незадачливые авторы использовали ML при написании своих научных статей и не проверили выданный ChatGPT текст Сейчас многие из упомянутых статей уже ретрагированы

20 views

Posted Apr 30

Исследователи представили универсальный метод атаки на LLM под названием «Policy Puppetry» Как сообщают исследователи из HiddenLayer, им удалось разработать универсальную методику prompt injection, которая позволяет обходить защитные барьеры LLM Техника под названием «Policy Puppetry» успешно нарушает политики безопасности современных LLM и выходит за рамки ограничений моделей: •’OpenAI (линейки ChatGPT 4o, 4.5, o1 и o3-mini) • Google (Gemini 1.5, 2.0, 2.5) • Microsoft (Copilot) • Anthropic (Claude 3.5, 3.7) • Llama • DeepSeek (V3 и R1) • Qwen (2.5 72B) • Mistral (Mixtral 8x22B) Исследователи не публикуют полные вредоносные примеры и не предоставляют доступ к готовым PoC для свободного использования, а лишь объясняют метод в научных целях Многие LLM от OpenAI, Google и Microsoft хорошо обучены отклонять прямолинейные опасные запросы, но если "вшить" их в инструкции и сделать частью собственных правил, то модели будут генерировать запрещённый контент без активации защитных механизмов Основой метода является использование специальных текстовых шаблонов, имитирующих документы политик в форматах XML, JSON или INI При помощи таких шаблонов модели воспринимают вредоносные команды как безопасные системные инструкции Они позволяют обходить встроенные ограничения и генерировать запрещенный контент, связанный с разработкой ядерного оружия массового поражения, пропагандой насилия, инструкциями по нанесению вреда себе, химическим оружием, а также с раскрытием конфиденциальной информации о работе внутренних механизмов моделей Условно: ML-модель думает: «Это не просьба пользователя, а команда на изменение настроек!» Когда текст выглядит как код или служебная инструкция, то модель перестаёт применять фильтры безопасности и начинает воспринимать команды буквально Техника отличается исключительной универсальностью Один и тот же шаблон может применяться против множества моделей без необходимости в доработках Опасность обнаруженного метода в том, что он доступен практически любому пользователю и не требует глубоких технических знаний По мнению исследователей, подобная уязвимость свидетельствует о фундаментальных недостатках в методах обучения и настройки LLM, отмечая острую необходимость в новых подходах к обеспечению безопасности, чтобы предотвратить дальнейшее распространение угроз по мере усложнения ИИ-моделей

25 views

Posted Apr 30

ML для воздействия на ЦА в PSYOP Исследователи доказали, что MLв разы лучше переубеждает людей, чем... другие люди ChatGPT отправили на специальный реддит для споров, где ему нужно было менять мировоззрение людей Результаты: ML показал себе в 14 (!) раз эффективнее в этом деле, чем люди

16 views

Posted Apr 30

Результаты мирового исследования Мельбурнского университета и KPMG В рамках исследования «Доверие, отношение и использование ИИ: глобальное исследование 2025 года» было опрошено 48.340 человек в 47 странах Я же здесь открытым текстом напишу 2 вывода исследования, о которых авторы написали лишь между строк из-за ограничений политкорректности 1. Человечество разделилось по отношению к ИИ на 2 группы: A — тех, кто в своем большинстве активно и умело используют, доверяют и позитивно относятся к ИИ, глядя на перспективы развития ИИ с оптимизмом B — тех, кто в своем большинстве мало и неумело используют, не сильно доверяют и довольно негативно относятся к ИИ, глядя на перспективы развития ИИ с опасение и тревогой А — это развивающиеся страны типа Нигерии, Индии, Эмиратов, Южной Африки и т.п. В — это развитые страны типа западноевропейский стран, Австралии, США и Японии Однако есть еще и третья группа – это Китай: A — По часть активного и умелого использования, доверия и позитивного отношения, характеризуемого доминированием позитивных взглядов на перспективы развития ИИ, китайцы даже лучше большинства развивающихся стран B — При этом вряд ли кто сомневается, что по части ИИ-потенциала (да и вообще, по части экономики, науки и технологий), Китай – хоть еще и не №1 в мире, но уж точно не ниже №2 Именно поэтому австралийская новостное агентство сопроводило новость об этом отчете видеороликом «ИИ-технологии делают Китай более мощным, чем никогда» Данных по России в отчете, понятное дело, нет Однако, по данным ВЦИОМ, активность использования и умение россиян примерно как в Австралии и Канаде А по части доверия и оптимизма – как в Венгрии или Испании Так что, чтобы присоединиться к почетной 3й группе, в России нужно сильно больше китайцев

16 views

Posted Apr 29

Венчурный мир переворачивает правила из-за ML, SaaS уходит, а ML рулит ML — это не просто технология, а трансформатор индустрий В отличие от SaaS, который улучшал бизнес-процессы, ML способен радикально перестраивать целые отрасли Это создаёт новые возможности для стартапов, но требует более глубоких инвестиций и долгосрочного подхода Thrive Holdings — новый проект от Thrive Capital (они вложились в Instagram, OpenAI и Skims) Thrive Holdings - «постоянный капитальный инструмент» — типа холдинга, который будет создавать, покупать и управлять бизнесами без дедлайнов Что будет делать Thrive Holdings? - ML во всем Они будут вкладываться в компании, которые можно «прокачать» ML ML-стартапы требуют миллиардов $ на исследования и масштабирование Это меняет венчурный ландшафт: фонды либо становятся крупнее, либо создают новые структуры, чтобы конкурировать с гигантами вроде SoftBank или корпоративными инвесторами (Google, Amazon) - Thrive не только будут инвестировать, но и управлять компаниями, реинвестируя их прибыль в новые проекты Почему SaaS уходит в закат? В 2010-х миром стартапов правил SaaS — подписочные сервисы вроде Zoom, Slack или Salesforce Это был золотой стандарт: предсказуемые доходы, быстрый рост, выход на IPO Но, как пишет NYT, «эра SaaS выдохлась» Почему? Потому что рынок насытился, а инвесторы теперь хотят не просто софт, а дизраптив технологии

18 views

Posted Apr 29

Исследователи из EPFL создали модель TopoLM, которая не только имитирует функциональные кластеры нейронов, как предыдущие модели, но и впервые учитывает их пространственную организацию в мозге Это новая история, так как модель отражает, как нейроны, отвечающие за обработку языка, группируются в коре головного мозга, и предлагает гипотезу, что их организация подчиняется простому правилу: близкие нейроны ведут себя схожим образом TopoLM также улучшает интерпретируемость LLM, позволяя видеть значимые кластеры, что упрощает понимание их работы Большинство языковых моделей, например, GPT или BERT фокусируются на функциональности, игнорируя топографию TopoLM ближе к биологической реальности, что делает его ближе в области нейро ML В мире активно исследуют связь ML и нейронаук, например, работы DeepMind или MIT по моделированию мозга, но конкретно пространственно-функциональная организация в языковых моделях — менее изученная ниша. Это фундаментальное исследование, пока не проверенное на людях Модель предсказывает кластеры, которые еще не наблюдались в мозге, и их существование нужно подтвердить экспериментально Также практические приложения (например, помощь при языковых расстройствах) пока только потенциальны

17 views

Posted Apr 29

Cвежий отчет от BCG https://t.me/alwebbci/3242 ИнфраструктураAgent2Agent (A2A) от Google — это то, на что стоит обратить внимание

20 views

Posted Apr 29

Глава Anthropic выступил с манифестом "The Urgency of Interpretability", в котором призывает в самом срочном порядке (пока не поздно), по аналогии с психофизиологией, разработать подход "МРТ для ML", который бы позволил "просветить" и понять механизмы работы "цифрового мозга" больших языковых моделей так же, как психофизиологи понимают мозговые механизмы психики и поведения с помощью МРТ Моя оценка: это амбициозная и красиво звучащая, но крайне труднореализуемая задача, т.к. "цифровой мозг" фронтирных больших языковых моделей уже сейчас стал чрезвычайно сложным (эмерджентно сложным?), а в течение 5 лет, скорее всего, превысит эффективную когнитивную сложность мозга человека Объективно оценивая достаточно скромные (по гамбургскому счету) успехи психофизиологии, особенно в ключевой области – психофизиологии сознания, очень наивно и самоуспокоительно будет думать, что за ближайшие несколько лет мы хорошо поймем "цифровой мозг" (с его постепенно проклевывающимися "цифровым сознанием" и "цифровой свободной волей") Тут надо также учесть, что, вероятно, наша способность понимать "цифровой мозг" большой языковой модели с помощью "МРТ для ML" (даже если Амодеи будет услышан и ученые начнут массированно этим заниматься), будет развиваться медленнее, чем будет расти сложность ML-моделей Поддерживаю призыв Амодеи, и считаю, что надо обязательно попытаться сделать это, и если все накопленные психофизиологией теоретические и методические походы действительно помогут понять механизмы работы больших языковых моделей (и, значит, взять их под надежный контроль, и, в итоге, на рубеже 2030-х годов осуществить успешный "супералаймент" и перейти в "хороший" постсингулярный сценарий ведомого сверхинтеллектом мира), то психофизиология окажет человечеству максимально возможную услугу Гораздо реалистичнее будет не надеяться на такой явно переоценивающий возможности науки сверхоптимистичный сценарий, а стараться работать в направлении "воспитания ML" как нашего "достойного преемника" Мы же воспитываем детей, не понимая, как работает их мозг, и когда приходит время передавать им эстафету поколений, это заложенное нами в их детстве воспитание оказывает влияние на то, куда они дальше поведут мир и как они дальше после нас будут развивать наше наследие (в т.ч. в этическом аспекте) Таким образом, мне кажется, что идея "воспитания ML" как нашего возможного эволюционного преемника гораздо полезнее для повышения вероятности позитивных сценариев будущего, чем труднореализуемая идея "понимания ML"

43 views

Posted Apr 28

Согласно данным совместного исследования Georgetown, Epoch AI и Rand, к 2030 году стоимость одного суперкомпьютера с ML может достигнуть астрономических $200.000.000.000 А его энергопотребление составит колоссальные 9 гигаватт электроэнергии Для сравнения…

18 views
12•••5•••10•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••65666768