TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15445 · Jan 28

#python#agentic_ai#agents#ai#ai_agents#realtime#stt#tts#video_agents#video_ai#vision_ai#voice_ai Vision Agents is an open-source Python framework by Stream to build real-time AI agents that watch video, listen to audio, and respond instantly with low latency under 30ms. It integrates YOLO, Roboflow, OpenAI, Gemini, and 25+ tools for apps like golf coaching, security cameras detecting theft, or phone assistants. Install easily with `uv add vision-agents`, use free Stream credits, and deploy on any video network. You benefit by quickly creating smart video AI for gaming, safety, or coaching without vendor lock-in, saving time and costs on custom builds. https://github.com/GetStream/Vision-Agents

Results

1 similar post found

Search: #mobileagents

当前筛选 #mobileagents清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8920 · 11/01/2025, 01:25 PM

🆕 Новый сильный GUI-агент: UI-Ins от TongyiLab и RUC Это модель, которая уверенно работает с мобильными интерфейсами и лучше понимает намерения пользователя. Она рассматривает команду как цепочку рассуждений, а не как одно действие, поэтому справляется со сложными задачами стабильнее. Результаты UI-Ins показал 74.1% успешных действий в AndroidWorld. Для сравнения: Gemini 2.5 Computer Use - 69.7%. То есть модель чаще правильно выполняет задачи в реальных интерфейсах. Модель: - пытается понять цель, а не только текст команды - строит несколько вариантов рассуждений - выбирает подходящую стратегию перед действием - адаптируется, если состояние приложения меняется Идет в двух версиях: 7B и 32B. Если вы работаете над агентами, которые должны нажимать кнопки, заполнять формы, открывать приложения и следовать шагам в интерфейсе - UI-Ins стоит добавить в список моделей для тестов. 🤖 UI-Ins-7B: https://modelscope.cn/models/Tongyi-MiA/UI-Ins-7B UI-Ins-32B: https://modelscope.cn/models/Tongyi-MiA/UI-Ins-32B 📄arXiv: https://modelscope.cn/papers/2510.20286 @ai_machinelearning_big_data #AI#Agents#GUI#MobileAgents#AndroidWorld#LLM