Содержимое
🤖Автоматизировал проверку проектов 17 команд студентов за вечер 2 недели назад был на AI Talent Camp одна из задач экспертов (в том числе моя) была тестировать и оценивать продукты 17 команд. Вручную это боль: долго, бывает субъективно, еще тратить время для формирования нормального отчёта. Собрал систему автоматического тестирования: Claude Agent SDK + Playwright MCP (кстати еще вышел недавно Playwright CLI, он работает шустрее, поэтому сейчас целесообразнее использовать его). Агент сам открывает сайт студентов в браузере, кликает, вводит данные, заполняет формы, делает скриншоты и выставляет оценки по трём измерениям: UX, Functionality, Performance. Два режима тестирования: 🔍Blind: агент заходит как новый пользователь, без контекста. Проверяет первое впечатление, понятность интерфейса. 📖Contextual: агент читает README проекта и проверяет, реально ли работают заявленные фичи. Причём агент не просто смотрит, он сам готовит нужные тестовые данные, вставляет их в сервис и валидирует результат. Полноценное E2E-тестирование. По итогу автоматика выставляет оценку в лидерборд, пишет развёрнутый комментарий и генерирует полный отчёт тестирования в формате PDF со скриншотами прямо из сервисов. В лидерборде видно скор каждой команды, а в деталях пояснения к каждой оценке и возможность скачать отчёты. Стек: Claude Agent SDK, Playwright MCP, FastAPI, PostgreSQL 📎Презентация о том, как это устроено