Post #4522

@startupandtech

🚀 Андрей Артищев

Просмотры44Количество просмотров

Опубликован21 июл.21.07.2025, 20:34

Содержимое поста

Содержимое

Мы уже протестировали извлечение фактов на пользователях, что проходили тестирование и получили ряд интересных наблюдений. Работа в команде с Петром. Я отвечал за продуктовую часть и ресёрч, а Пётр (МФТИ) реализовал мемори-менеджмент, генерацию синтетических датасетов для tool-call, дообучение модели на кастомных reward-функциях (GRPO, Qwen3 4B) и тестирование. Мы также сделали телеграмм-бота, который был запущен на машине в cloud.ru и показывал участникам конференции, как разные модели (с/без memory as a tool взаимодействуют). По итогам проект показал результаты выше бенчмарков. Прилагаю в отдельном сообщении презентацию и научную статью. Мастер-классы и воркшопы по LLM-агентам. Особо ценными стали 6 лекций и воркшоп по агентам на базе LLM, где моя команда единственная реализовала рабочий прототип, к моему великому удивлению стал значимым мой вклад, так как ранее весной я учил курс по llm-агентам на hugginface и делал ряд прототипов в рамках этого курса: 1. Агент собирал от пользователя точки маршрута. 2. Второй агент через DuckDuckGo web-search находил POI вдоль пути. 3. Третий агент осуществлял рефлексию 4. Четвёртый агент формировал итоговый результат.