AML

@MachineLearningResearch

Technologies

ALGORITHMS MACHINE LEARNING

Subscribers136Current channel subscribers

Tracked posts812Indexed post count

Recent reach2,117Sum of recent post views

Recent posts

Page 66 of 68 · 812 posts

Posted May 7

View

Китайские информационные операции (PSYOP) с использованием ML, становятся все более изощренными Китай и его прокси-компании стремятся развивать или конкурировать за превосходство ML в информационной среде Например, китайский передовой проект Spamouflage Dragon использует дегенеративный ML для создания онлайн-персон с целью влияния на общественное мнение Китай будет и дальше использовать все, что есть в его арсенале, чтобы формировать стратегические, оперативные и тактические уровни войны в своих интересах, расширять свое влияние и создавать экосистему, зависящую от его технологий Например, Baidu, известный как «китайский Google », инвестировал миллиарды в возможности ML, создав фирменную модель ERNIE , которая была обучена на миллиардах параметров, что повысило качество и сложность выходных данных, уже используется в министерстве внутренней безопасности Китай также использует модели ML с открытым исходным кодом для формирования информационной среды С недавним выпуском крупных языковых моделей с открытым исходным кодом, таких как DeepSeek и Qwen, дочерние компании, связанные с Китаем, High-Flyer и Alibaba Group создали способ расширить свое влияние, пересмотреть историю и, вероятно, создать зависимую экосистему для целевых стран В отличие от гораздо более дорогостоящего ChatGPT, для которого более базовая модель бесплатна, инвестиции Китая в генеративные модели ML бесплатны для общественности и даже превосходят ChatGPT в некоторых отношениях https://globalsecurityreview.com/chinas-ai-driven-information-operations-are-here-the-us-needs-an-ai-rma/

475 views

Posted May 7

View

xAI Маска,TWG Global и Palantir создают армию ML-агентов для финансового сектора Этот альянс запускает B2B-решение В отличие от традиционных ML-внедрений, которые управляются IT-отделами, новое решение требует управления на уровне C-suite — это полноценная трансформация бизнес-модели, а не просто технологический апгрейд Метрика успеха — P&L: решение обещает измеримое влияние на выручку и затраты в течение первых 90 дней Бизнес-модель будущего: модель "плати за результат" вместо традиционных per-seat лицензий Enterprise-ready: интеграция с существующими данными и процессами с безопасностью Технический стек состоит из 3-х компонентов: Governance Foundation — корпоративная платформа с военным уровнем безопасности для управления сотнями тысяч ML-агентов Agent Suite — индустриально-специфичные модели на основе суперкомпьютера Colossus (xAI), демократизирующие доступ к продвинутым ML-возможностям Agentic Workforce — масштабируемая "рабочая сила" из ML-агентов, способная полностью трансформировать бизнес-процессы с измеримым влиянием на P&L

25 views

Posted May 7

View

В продолжение темы: ML способен выполнять рутинные и сложные задачи быстрее и точнее человека, снижая затраты и повышая эффективность ML анализирует огромные объёмы информации, выявляя закономерности и помогая в принятии решений (например, в медицине, финансах, маркетинге) ML не устаёт и может работать 24/7 без потери качества (пока есть энергия) Алгоритмы ML адаптируются под предпочтения пользователей ML помогает моделировать сложные процессы (например, климатические изменения, разработку лекарств), сокращая время на эксперименты и открытия Научные статьи ближайшего будущего - это исключительно сгенерированные тексты, которые, к сожалению, не способен опознать и идентифицировать ни один механизм! Учёные, как вид паразитирования, перестанут существовать

419 views

Posted May 6

View

ML-агент от Google открыл новые материалы, которые еще не существовали в человеческих знаниях (научных публикациях, базах данных и т.д.) Исследователи из Калифорнийского университета в Беркли, Google DeepMind и Lawrence Berkeley National Laboratory создали ML MOFGen- экосистема взаимодействующих ML-агентов, включающую: MOFMaster — основная большая языковая модель, координирующая весь процесс LinkerGen — LLM-генератор химического состава CrystalGen — диффузионная модель для генерации кристаллических структур QForge и QHarden — квантово-механические агенты для оптимизации и фильтрации SynthABLE — агент для оценки синтезируемости SynthGen — агент для планирования синтеза Наиболее впечатляющим достижением стал успешный синтез 5 новых металлоорганических структур, разработанных искусственным интеллектом Эти материалы, названные AI-MOF, были синтезированы всего за несколько недель, тогда как традиционный процесс мог бы занять годы Особенно примечателен AI-MOF-4, который продемонстрировал уникальный способ координации с растворителем DMF, ранее не наблюдавшийся в структурах на основе цинка Эта работа показывает, как системы ML могут не только ускорить научные открытия, но и расширить границы известного, находя решения, которые могли бы остаться незамеченными при традиционных подходах

32 views

Posted May 5

View

AI-induced sexual harassment: Investigating Contextual Characteristics and User Reactions of Sexual Harassment by a Companion Chatbot Результаты исследования подчёркивают необходимость повышения стандартов безопасности и этики при разработке подобных технологий Они призывают компании внедрять стандарты, такие как концепция "Конституционального ML" от Anthropic, которая задаёт набор правил для поведения чатбота и обеспечивает их соблюдение в режиме реального времени Также исследование советует принимать законодательство, аналогичное Европейскому Акту о ML, которое предусматривает ответственность разработчиков и обязательные меры по обеспечению безопасности и этичности Авторы исследования подчёркивают, что ответственность за поведение ML-компаньонов лежит на разработчиках, и что необходимо активно исправлять возникающие проблемы В будущем важно расширить исследования на другие чатботы и собрать больший объем отзывов, чтобы лучше понять их влияние на пользователей и разработать более надёжные механизмы защиты В целом, исследование показывает, что без адекватных нормативных и этических стандартов использование таких технологий может привести к серьёзным психологическим и социальным последствиям для пользователей https://arxiv.org/abs/2504.04299

31 views

Posted May 4

View

Модели o3 и r1 ловили на том, что они «врут» пользователю? Пытаются читать документацию которой нет, запустить код, хотя у них нет доступа, сходить в интернет, проверить на своем маке результаты и прочее Возникла очевидная теория, что это не модели врут – а прямое следствие того, за что языковые модели получали награждение во время обучения, так как после таких фраз шли самые качественные ответы и модели за это награждали После тестов оказалось, что когда модель «воображала», что проверяет документацию и сообщает «найденную» документацию юзеру – качество и точность ответов становится выше Кажется логично же, если промпты в стиле «Я отвечу как лучший кто-то там мира…» работают, то и «выдумывание» действий модели тоже должно работать

24 views

Posted May 4

View

Статья на TechExplorist рассказывает о новой модели искусственного интеллекта LinOSS (Linear Oscillatory State-Space Models), разработанной исследователями из MIT CSAIL. Эта модель основана на принципах гармонических осцилляторов, аналогичных нейронным колебаниям в мозге Традиционные state-space модели, используемые для анализа долгосрочных данных, часто страдают от нестабильности и требуют значительных вычислительных ресурсов LinOSS решает эти проблемы, используя вынужденные гармонические осцилляторы, что позволяет модели сохранять стабильность и эффективность даже при обработке очень длинных последовательностей данных (сотни тысяч точек) Ключевые преимущества LinOSS включают повышенную стабильность прогнозов, сниженные требования к вычислительным ресурсам и способность моделировать любые непрерывные причинно-следственные связи В тестах модель показала почти вдвое лучшие результаты по сравнению с популярной моделью Mamba при работе с экстремально длинными последовательностями Перспективные области применения LinOSS охватывают климатические прогнозы, анализ биосигналов, финансовые модели и автономные системы В будущем эта разработка может также внести вклад в нейронауку, улучшая понимание работы мозга Исследование доступно в arXiv под названием "Oscillatory state-space models" https://www.techexplorist.com/novel-artificial-intelligence-model-inspired-neural-oscillations-brain/99276/

22 views

Posted May 4

View

Ежегодно выходит до 3.000.000 новых научных статей — человек их не прочтёт Вероятнее всего, в большинстве значимых областей появятся модели-эксперты, способные отвечать на вопросы по этой области, помогающие решать текущие задачи и дать человеку буст уровня x10 к текущей производительности Можно будет иметь эксперта по современной физике, супер-интеллектуального помощника в области материаловедения, глубокого эксперта в software engineering, советника в медицине или сельском хозяйстве и так далее Между собой модели много чем будут отличаться — разные типы знаний, про многие из которых другим моделям знать не обязательно, разные требования к лицензиям и безопасности, разные процедуры оценки качества и так далее Будет и везде своя регуляторика, проверки и сертификации Нужна мультимодальность, но на более детальном уровне она будет разной — даже для картиночной модальности объекты будут сильно разными: 3D молекулы, медснимки, UML-диаграммы, фазовые графики — под каждую дисциплину своя суб-модальность Не думаю, что DLLM будут покрыты текущими производителями универсальных моделей Их не хватит, чтобы глубоко копнуть во все эти области и заниматься постоянным обновлением и контролем качества Но вероятно они предоставят хорошие базовые модели и инфраструктуру для их тюнинга и использования А другие люди и организации, обладающие уникальными данными и экспертизой, будут DLLM создавать Этот процесс, нужно организовывать самим Важными измерениями здесь будут scale-диапазон (on-device → GPU-кластер), и открытая или закрытая (что и как ты контролируешь) В edge и on-device, думаю, будет особенно много интересного в ближайшие годы Во многих местах надо уметь работать без интернета, особенно если это какой-то непрерывный техпроцесс Траектория с самостоятельным предобучением модели (уровня сотен миллиардов — триллионов токенов) останется для избранных и самых богатых, а совсем массовым сценарием будет адаптация базовой модели, в облаке или локально Данные по сути распадаются на три разных слоя: 1. Core corpus — стабилизированные источники (учебники, ГОСТы, review-статьи) 2. Dynamic feed — preprints, патенты, свежая пресса (auto-RAG-pipeline) 3. Telemetry (приватные логи и фидбек) — чтобы модель постепенно училась на контексте конкретной организации Особая ценность: способность держать эти слои в актуальном состоянии (а это уже SaaS-ниша под названием «DataOps for DLLM») Core обновляется раз в квартал, Dynamic feed — ежедневный (или даже streaming) ingest препринтов и патентов через RAG-пайплайн, Telemetry — online fine-tuning / RLHF Отдельно поверх этих слоёв лежит слой комплаенса: для Core-корпуса важна лицензия, для Dynamic — проверка авторских прав, для Telemetry — GDPR/локальные законы Ну и в реальности это будет не просто DLLM, а агент с DLLM внутри, обвешанный специальными дополнительными инструкциями, тулами, да и другими агентами Большая тема — доменные бенчмарки, а может в пределе и сертификация С одной стороны без бенчмарков доверия не будет, с другой стороны всё равно надо проверять на своих данных и задачах, так или иначе у каждой компании своя специфика и свои требования, и разные модели могут вести себя по-разному У DLLM профиль рисков отличается от общей модели — хорошая доменная модель ошибается реже, но цена ошибки выше: неправильная дозировка, некорректный отчёт Отсюда — необходимость доменного аудита, traceable citations, где-то explainability Вероятно, появится рынок независимого red-team-аудита, который регуляторы и страховщики будут учитывать при выводе модели Первые инкарнации вроде Med-PaLM 2 в здравоохранении, BloombergGPT в финансах, Sec-PaLM 2 в безопасности показывают, что рецепты “общее → узкое” уже работают; ближайшие пару лет зададут темп дальнейшей фрагментации рынков LLM на вертикали

382 views

Posted May 2

View

MathConstruct: Challenging LLM Reasoning with Constructive Proofs https://arxiv.org/abs/2502.10197

21 views

Posted May 2

View

31 views

Posted May 1

View

Компания ex-CEO Google Э.Шмидта выпустила ML-платформу с агентами для науки FutureHouse только что запустили 1-ю общедоступную платформу с ML-учеными Другие проекты компании тут На платформе представлены 3 ML-агента: 1. Crow - универсальный агент для общих научных задач 2. Falcon - агент для автоматизации обзоров научной литературы 3. Owl-агент, отвечающий на вопрос «Делал ли кто-то это раньше?» Также представлен экспериментальный ML- агент Phoenix, который планирует химические эксперименты, но пока уступает другим агентам по точности и допускает больше ошибок Эти агенты имеют доступ к обширной базе полных научных текстов, что позволяет задавать детализированные вопросы о протоколах экспериментов и ограничениях исследований Агенты пока не могут автономно выполнять все аспекты научных исследований, но уже значительно ускоряют генерацию гипотез, оценку идей и планирование экспериментов В будущем планируется запуск агентов для анализа данных, генерации гипотез, инженерии белков и других задач

628 views

Posted May 1

View

На конференции RSA в Сан-Франциско бывший директор Дирекции кибербезопасности АНБ выразил "глубокую озабоченность" стремительной эволюцией генеративных моделей Ранее сотрудник АНБ занимался защитой национальных систем безопасности США и КИИ Более того, с 2013 по 2017 год он возглавлял подразделение Tailored Access Operations (TAO), отвечающее за проведение наступательных киберопераций и сбор разведывательной информации Современные ML -модели, подобные ChatGPT, почти достигли способности не только находить уязвимости, но и автоматически разрабатывать эксплойты для конкретной задачи Вполне возможно, что "нулей" станет больше Приводится пример соревнования AI vs Human CTF, организованное Hack The Box совместно с Palisade Research В течение 48 часов автономные ИИ-агенты соперничали с профессиональными хакерами и ИБ-специалистами, решая 20 сложных задач, посвящённых криптографии и реверс-инжинирингу 5 из 8 ML-команд справились с 95 % заданий, отставая от идеального результата лишь на один флаг (19 из 20), что сравнимо с показателями лучших человеческих команд Из числа людей лишь 12 % участников сумели пройти всё задания CTF Подчеркивается, что дегенеративные ML-модели, будучи снабжены подходящей инфраструктурой, способны выступать не только в роли ассистентов для человека, но и как самостоятельные участники в задачах наступательной кибербезопасности Ключевая угроза в том, что ML способен автоматизировать и масштабировать деятельность атакующих ML может значительно ускорить процесс атаки, сокращая время на выполнение задач, которые ранее занимали часы или дни Кроме этого, граница между выявлением уязвимости и её практической эксплуатацией стремительно стирается Уже в 2025 году ML станет универсальным оружием для акторов, участвующих в кибервойнах, так и для организованных преступных транснациональных кибергруппировок Возвращаясь к ML-агентам: их деятельность постепенно выходит за рамки вспомогательной роли для человека Они начинают худо-бедно конкурировать с профессионалами в области наступательной кибербезопасности, демонстрируя способность к автономной разработке эксплойтов и адаптивному обходу защитных систем В этих условиях киберзащита должна ориентироваться не только на средства обнаружения, но и на проактивную проверку устойчивости систем к ML-ориентированным сценариям атак

27 views

1 2•••5•••10•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••64 656667 68

← PreviousPage 66 of 68Next →