#typescript#agent#ai#ai_agents#browser_automation#javascript#typescript#ui_automation#web
Page Agent is an open-source tool that lets you control webpages with simple natural language commands, like "Click the login button." It runs directly in your browser with one line of code—no extensions, Python, or screenshots needed—and works with your own AI models for privacy. Use it for fast form filling, AI copilots in apps, accessibility via voice, or multi-page tasks. This saves time by turning clicks into sentences, making complex web apps easy and accessible for everyone.
https://github.com/alibaba/page-agent
Совершенно обалденный пост, в котором по шагам разбирается работа GPS. Вы только взгляните на все эти интерактивные визуализации. Страшно становится, когда прикидываю, сколько в один этот пост было вложено труда. Ну и GPS, конечно, теперь ещё более внушительной штукой выглядит.
#gps#navigation