TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15536 · Mar 3

#python#agent#chatbot#large_language_models#llm#llm_agent#mcp#multi_agent#multi_modal#react_agent AgentScope is a simple, production-ready framework to build AI agents fast. Install with `pip install agentscope` (Python 3.10+), then create ReAct agents with tools, memory, voice, human steering, multi-agent workflows, and finetuning in 5 minutes. It supports realtime voice, A2A protocols, RL training, and easy deployment locally, in cloud, or Kubernetes. You benefit by quickly making robust, scalable agents for tasks like games, research, or chats without complex coding, saving time and enabling real-world apps. https://github.com/agentscope-ai/agentscope

Results

2 similar posts found

Search: #visionlanguage

当前筛选 #visionlanguage清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8742 · 10/10/2025, 02:45 PM

🚀Qwen выпустили гайд по работе с Qwen3-VL! Это подборка интерактивных ноутбуков, демонстрирующих возможности Qwen3-VL - как при локальном запуске, так и через API. Внутри - десятки реальных примеров с разборами: ▪ Работа с изображениями и рассуждение по ним ▪ Агент для взаимодействия с интерфейсами (Computer-Use Agent) ▪ Мультимодальное программирование ▪ Распознавание объектов и сцен (Omni Recognition) ▪ Продвинутое извлечение данных из документов ▪ Точное определение объектов на изображении ▪ OCR и извлечение ключевой информации ▪ 3D-анализ и привязка объектов ▪ Понимание длинных документов ▪ Пространственное рассуждение ▪ Мобильный агент ▪ Анализ и понимание видео 🟠GitHub: https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks 🟠API-документация: https://alibabacloud.com/help/en/model-studio/user-guide/vision/ 🟠Попробовать: https://chat.qwen.ai/?models=qwen3-vl-plus 🟠Qwen3-VL: https://github.com/QwenLM/Qwen3-VL/blob/main/cookbooks @ai_machinelearning_big_data #Qwen#Qwen3VL#AI#VisionLanguage#Multimodal#LLM

Machinelearning

@ai_machinelearning_big_data · Post #8792 · 10/16/2025, 02:10 PM

📄PaddleOCR-VL (0.9B) — компактная Vision-Language модель нового поколения Команда Baidu AI представила PaddleOCR-VL (0.9B) — сверхлёгкую VLM-модель, которая достигает SOTA-точности в задачах распознавания: - текстов, - таблиц, - формул, - графиков 💡Под капотом: - NaViT - динамический vision-энкодер - ERNIE - облегчённая языковая модель от Baidu ⚡️ Поддержка 109 языков. 🟠GitHub: https://github.com/PaddlePaddle/PaddleOCR) 🟠HuggingFace: https://huggingface.co/PaddlePaddle/PaddleOCR-VL 🟠Docshttps://paddleocr.ai/latest/en/index.html @ai_machinelearning_big_data #BaiduAI#PaddlePaddle#Ernie#PaddleOCR#VisionLanguage#AI#OCR