TGTGInsightаналитика telegramLIVE / telegram public index
К списку каналов
AGIRussia.news (ОИИРоссия.новости) avatar

TGINSIGHT CHAT

AGIRussia.news (ОИИРоссия.новости)

@agirussianews

Технологии

Новости русскоязычного сообщества разработчиков AGI

Подписчики877Текущее число подписчиков
Постов1,003Проиндексировано постов
Охват2,252Просмотры последних постов
Последние посты

Последние посты

Стр. 1 из 84 · 1,003 постов

Опубликован 23 апр.

https://vkvideo.ru/video-210968399_456239249

119 views

Опубликован 22 апр.

https://www.youtube.com/@siberai/videos

133 views

Опубликован 22 апр.

https://arxiv.org/abs/2604.19633 Time Series Augmented Generation for Financial Applications Anton Kolonin, Alexey Glushchenko, Evgeny Bochkov, Abhishek Saxena Evaluating the reasoning capabilities of Large Language Models (LLMs) for complex, quantitative financial tasks is a critical and unsolved challenge. Standard benchmarks often fail to isolate an agent's core ability to parse queries and orchestrate computations. To address this, we introduce a novel evaluation methodology and benchmark designed to rigorously measure an LLM agent's reasoning for financial time-series analysis. We apply this methodology in a large-scale empirical study using our framework, Time Series Augmented Generation (TSAG), where an LLM agent delegates quantitative tasks to verifiable, external tools. Our benchmark, consisting of 100 financial questions, is used to compare multiple SOTA agents (e.g., GPT-4o, Llama 3, Qwen2) on metrics assessing tool selection accuracy, faithfulness, and hallucination. The results demonstrate that capable agents can achieve near-perfect tool-use accuracy with minimal hallucination, validating the tool-augmented paradigm. Our primary contribution is this evaluation framework and the corresponding empirical insights into agent performance, which we release publicly to foster standardized research on reliable financial AI. Генерация текстов для анализа временных рядов для финансовых приложений (и разработка БЯМ-приложений на основе бенчмарков) Антон Колонин, Алексей Глущенко, Евгений Бочков, Абхишек Саксена Оценка возможностей больших языковых моделей (LLM) для сложных количественных финансовых задач является критической и нерешенной проблемой. Стандартные бенчмарки часто не позволяют выделить основную способность агента анализировать запросы и организовывать вычисления. Для решения этой проблемы мы представляем новую методологию оценки и бенчмарк, разработанный для строгого измерения логического мышления агента LLM при анализе финансовых временных рядов. Мы применяем эту методологию в крупномасштабном эмпирическом исследовании с использованием нашей структуры, генерации с расширенным анализом временных рядов (TSAG), где агент LLM делегирует количественные задачи проверяемым внешним инструментам. Наш бенчмарк, состоящий из 100 финансовых вопросов, используется для сравнения нескольких современных агентов (например, GPT-4o, Llama 3, Qwen2) по метрикам, оценивающим точность выбора инструмента, достоверность и эффект галлюцинации. Результаты показывают, что способные агенты могут достичь практически идеальной точности использования инструментов с минимальным влиянием внешних факторов, что подтверждает эффективность парадигмы, основанной на использовании инструментов. Наш основной вклад заключается в этой системе оценки и соответствующих эмпирических данных о производительности агентов, которые мы публикуем для содействия стандартизированным исследованиям в области надежного финансового ИИ.

274 views

Опубликован 21 апр.

Уважаемые коллеги! Приглашаем Вас принять участие в работе конференции "Нейроинформатика-2026". XXVIII Международная научно-техническая конференция "Нейроинформатика-2026" состоится 19-23 октября 2026 года в Московском физико-техническом институте (МФТИ) по адресу: Московская обл., г. Долгопрудный, Институтский пер., д. 9. Информацию о работе конференции и подготовке докладов можно найти на сайте: https://neuroinfo.ru/index.php/ru/. Прием докладов будет осуществляться через систему OpenReview. Важно: если у Вас уже есть регистрация в системе OpenReview, повторно регистрироваться не нужно. Регистрация в системе OpenReview требуется только новым участникам. Ссылка на страницу конференции "Нейроинформатика-2026" в этой системе: https://openreview.net/group?id=neuroinfo.ru/Neuroinformatics/2026/Conference Перед созданием заявки на доклад ознакомьтесь с инструкцией по подаче докладов: https://neuroinfo.ru/conf/Arch/instruction.pdf На сайте конференции опубликованы информационное письмо и буклет конференции: https://neuroinfo.ru/conf/Arch/booklet.pdf Будем признательны за распространение этой информации среди коллег и заинтересованных специалистов.

145 views

Опубликован 21 апр.

📌Напоминаем, что уже в эту среду, 22 апреля в 18:30 состоится новая встреча "АйТи-посиделки"! Гость посиделок — Юрий Алексеевич Загорулько, заведующий Лабораторией искусственного интеллекта Института систем информатики имени А.П. Ершова СО РАН, кандидат технических наук. Поговорим о том, как начинались исследования искусственного интеллекта в новосибирском Академгородке, а именно в недрах Вычислительного центра СО АН СССР и о том, как развивалось направление «Искусственный интеллект» в организациях, возникших на базе этого академического института. Отметим особую роль, которую сыграли в зарождении и развитии этого направления в новосибирском Академгородке академики Андрей Петрович Ершов (19.04.1931 — 08.12.1988), о нем мы писали вчера, и Александр Семенович Нариньяни (02.11.1937 — 29.04.2010) который, по совместительству, был и министром юмора в Кафе-клубе "Под интегралом". По предложению А.П. Ершова в 1973 г. в ВЦ СО АН СССР была создана научно-исследовательская группа по тематике искусственного интеллекта во главе с А.С. Нариньяни, благодаря блестящему таланту и выдающимся организаторским способностям которого эта группа в 1977 году стала полноценной лабораторией и в дальнейшем внесла значительный вклад в развитие искусственного интеллекта в СССР и мире. К 1985 году лаборатория А.С. Нариньяни уже имела существенные достижения в таких областях, как компьютерная лингвистика, экспертные системы, программирование в ограничениях и др., поэтому сотрудники лаборатории были пригашены в первый в СССР проект создания ЭВМ нового поколения "Старт" (1985-1988 гг.), где получили ценный опыт промышленной разработки прикладных интеллектуальных систем и технологий. После «Старта» коллектив лаборатории во главе с А.С. Нариньяни успешно продолжал работы по искусственному интеллекту в различных организационных формах, но всегда на высоком научном уровне. 📍Итак, среда, 22 апреля, 18:30 Большая гостиная "АкадемВЦентре" Вход на посиделки: 350 рублей. Для студентов, пенсионеров, детей до 16 лет и работникам институтов Вычислительного центра (ИСИ, ИВМиМГ, ФИЦ информационных и вычислительных технологий) - скидка 100 рублей Модератор встреч "АйТи-посиделки" в Академбюро — Юлия Данилова - к.ф.-м.н., IT специалист ✅РЕГИСТРАЦИЯ При желании, захватите что-нибудь к чаю — с чаем посиделки уютнее😊

55 views

Опубликован 20 апр.

https://ya.ru/video/preview/4547972390371145664 https://ya.ru/video/preview/1063789317529605949 Год назад в Китае прошёл первый полумарафон среди бипедальных роботов. Тогда победителю среди роботов потребовалось 2 часа 40 минут, что заметно уступает результатам элитных спортсменов. Тогда я прокомментировал, что робот пробежал быстрее, чем может 3/4 населения Земли и результаты будут быстро расти - уже через год роботы будут бежать полумарафон быстрее двух часов... Но мой прогноз оказался излишне пессимистичным - в этом году на аналогичном полумарафоне победитель среди бипедальных роботов пробежал заметно быстрее одного часа - за 50 минут 26 секунд. Официальный мировой рекорд (среди людей) - 57 м 30 с. Недавно он был улучшен спортсменом из Уганды Джейкобом Киплима, пробежавшим полумарафон за 56 м 42 с, но этот результат пока не утверждён. Но даже если сравнивать с новым рекордом, то результат робота лучше на 6 м 16 с. Даже если роботы не продолжат прогрессировать на полумарафонских дистанциях, в ближайшие 10 (а может и 100...) лет люди не начнут бегать полумарафон быстрее 51 минуты. Ну а на настоящий момент ИИ продемонстрировал своё превосходство над всеми людьми не только в настольных играх, но и в беге на длинные дистанции.

148 views

Опубликован 20 апр.

Наконец-то создают память для ИИ-агентов на основе психики человека Эту работу написали ребята с русскоязычными корнями из компании Synthius AI. Они предлагают систему Synthius-Mem, которая решает задачу, как дать ИИ-агенту долговременную память, и авторы заявляют, что не галлюцинирует и работает точнее, чем человек. Авторы предлагают использовать 6 когнитивных доменов, они строят систему по аналогии с нейроанатомией человеческой памяти: биография, опыт, предпочтения, социальный круг, работа, психометрия. Идея в том, чтобы извлекать не что было сказано в диалоге, а что известно о человеке. Самая сильная часть - акцент на устойчивости к галлюцинациям. Большинство конкурентов эту метрику вообще не репортят, а для бизнес-внедрений это критерий доверия. Но есть нюансы. Авторы говорят, что Synthius-Mem достигает 94.37% точности на бенчмарке LoCoMo и 99.55% устойчивости к галлюцинациям. Тут надо обратить внимание, что сам бенчмарк LoCoMo проходит методологический кризис: публичный аудит обнаружил ~99 ошибок в эталонных ответах, реальный потолок - 93-94%. ByteRover 2.0 в феврале показал 92.2% - разрыв с Synthius в пределах погрешности теста. А Letta недавно показала 74% вообще без архитектуры памяти, просто складывая историю в файлы. Вопрос, наскольковажны все эти различия в дизайне? Если посмотреть на других игроков, то Google DeepMind не играют в LoCoMo, они выпустили Evo-Memory, где агент не вспоминает прошлое, а меняется от задачи к задаче. Supermemory, Zep и Backboard уходят на LongMemEval, где проверяют не память как таковую, а умение понимать, что она устарела. Synthius решает задачу хорошо. Но пока публикуется статья, поле уходит вперёд. Настоящая борьба разворачивается там, где бенчмарков ещё нет, а значит, нет и правил.

72 views

Опубликован 20 апр.

https://73online.ru/r/eks-rektor_politeha_yarushkina_napisala_bestseller_dlya_uchenyh_ot_ruki-164645

184 views

Опубликован 20 апр.

https://t.me/agitopics/25912/77119

169 views

Опубликован 20 апр.

https://aigents.timepad.ru/event/1412596/ Элементарный универсальный цикл непрерывного внимания как новая модель для вычисления обобщений мета-аттрактора — Алексей Кабанов (BTR R&D) 23 апреля 2026, 18:00 (время московское) - Элементарный и минимальный цикл внимания и как он выстраивает и поддерживает содержание сознания. - Подробно об архитектуре, модели данных, ключевом алгоритме и почему это инвариант существования и осуществления.

655 views

Опубликован 17 апр.

📣📣📣Новости для спикеров Data Fest 2026! 💖 Мы продлили дедлайн подачи докладов ДО 30 АПРЕЛЯ🎉 А еще мы пополнили и обновили итоговый список тем секций: • LLM Security (1.2 🤖) — про вопросы безопасности LLM и агентов, их exploit-ы, атаки и прочий abuse LLM • ML in Funtech (2.2 🦾️️️️️️) — ML кейсы технологии развлечений: от рекомендаций по лайкам и поиска по мемам до VR/AR приложений • LeanAI (3.1 💻) — практический GEN AI/ Agentic AI на ограниченном бюджете: решения, приносящие реальную пользу для бизнеса • LLM Inference (3.1 💻) — как заставить LLM работать быстро, дешево и на разных девайсах: железо и девайсы, алгоритмическая оптимизация, serving-инфраструктура • ML in DBMS (3.1 💻) — ML в подсистемах хранения и запросов • ML in Rust (3.1 💻) — применение языка Rust в DS и ML задачах и средах. • ML & Education (3.2 🎁) — и про применение ML в образовании и образовательном процессе, и про образование в ML 🦜 Успейте подать свой доклад до майских праздников — ждём ваши анкеты тут

102 views

Опубликован 17 апр.

https://vkvideo.ru/video-234464491_456239020

196 views
123•••5•••10•••15•••20•••25•••30•••35•••40•••45•••50•••55•••60•••65•••70•••75•••80•••8384
НазадСтр. 1 из 84Вперёд