TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15445 · Jan 28

#python#agentic_ai#agents#ai#ai_agents#realtime#stt#tts#video_agents#video_ai#vision_ai#voice_ai Vision Agents is an open-source Python framework by Stream to build real-time AI agents that watch video, listen to audio, and respond instantly with low latency under 30ms. It integrates YOLO, Roboflow, OpenAI, Gemini, and 25+ tools for apps like golf coaching, security cameras detecting theft, or phone assistants. Install easily with `uv add vision-agents`, use free Stream credits, and deploy on any video network. You benefit by quickly creating smart video AI for gaming, safety, or coaching without vendor lock-in, saving time and costs on custom builds. https://github.com/GetStream/Vision-Agents

Results

2 similar posts found

Search: #audiogen

当前筛选 #audiogen清除筛选

Resemble AI — полностью опен-сорсный проект! 🔗Репозиторий 🔗Онлайн-демо ✨ Возможности • Клонирование голоса по 5 секундам записи • Точный контроль эмоций — от едва уловимых до драматических • Синтез быстрее классического real-time инференса • Встроенный водяной знак для защиты контента 🛠 Все под лицензией MIT: можно свободно использовать, модифицировать и встраивать в свои проекты. #audiogen#opensource | AcidCrunch

Gemini 2.5 Pro Preview TTS Вышел мега-крутой синтез речи от Google! Отлично говорит по-русски и умеет передавать эмоции. Promt: *указываешь эмоцию или нарратив.* Текст пишешь со знаками препинания #audiogen#googleai | AcidCrunch