Намери подобно съдържание

Изходен канал @clockstackwheels · Post #848 · 24.07

После появления сторис в Телеграме я предложил одному из сотрудников идею специального типа стори для текста, потому что люди всё равно будут так делать, просто костылями. Сегодня ТикТок ввёл буквально такую же возможность. Кстати, постинг сторисов уменьшился уже где-то в 5-10 раз. Видимо, народ не распробовал. #web

Hashtags

#web

Резултати

Намерени 2 подобни публикации

Търсене: #visionlanguage

当前筛选 #visionlanguage清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #8742 · 10.10.2025 г., 14:45

Намери подобни Прегледай

🚀Qwen выпустили гайд по работе с Qwen3-VL! Это подборка интерактивных ноутбуков, демонстрирующих возможности Qwen3-VL - как при локальном запуске, так и через API. Внутри - десятки реальных примеров с разборами: ▪ Работа с изображениями и рассуждение по ним ▪ Агент для взаимодействия с интерфейсами (Computer-Use Agent) ▪ Мультимодальное программирование ▪ Распознавание объектов и сцен (Omni Recognition) ▪ Продвинутое извлечение данных из документов ▪ Точное определение объектов на изображении ▪ OCR и извлечение ключевой информации ▪ 3D-анализ и привязка объектов ▪ Понимание длинных документов ▪ Пространственное рассуждение ▪ Мобильный агент ▪ Анализ и понимание видео 🟠GitHub: https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks 🟠API-документация: https://alibabacloud.com/help/en/model-studio/user-guide/vision/ 🟠Попробовать: https://chat.qwen.ai/?models=qwen3-vl-plus 🟠Qwen3-VL: https://github.com/QwenLM/Qwen3-VL/blob/main/cookbooks @ai_machinelearning_big_data #Qwen#Qwen3VL#AI#VisionLanguage#Multimodal#LLM

Hashtags

#qwen #qwen3vl #ai #visionlanguage #multimodal #llm

Machinelearning

@ai_machinelearning_big_data · Post #8792 · 16.10.2025 г., 14:10

Намери подобни Прегледай

📄PaddleOCR-VL (0.9B) — компактная Vision-Language модель нового поколения Команда Baidu AI представила PaddleOCR-VL (0.9B) — сверхлёгкую VLM-модель, которая достигает SOTA-точности в задачах распознавания: - текстов, - таблиц, - формул, - графиков 💡Под капотом: - NaViT - динамический vision-энкодер - ERNIE - облегчённая языковая модель от Baidu ⚡️ Поддержка 109 языков. 🟠GitHub: https://github.com/PaddlePaddle/PaddleOCR) 🟠HuggingFace: https://huggingface.co/PaddlePaddle/PaddleOCR-VL 🟠Docshttps://paddleocr.ai/latest/en/index.html @ai_machinelearning_big_data #BaiduAI#PaddlePaddle#Ernie#PaddleOCR#VisionLanguage#AI#OCR

Hashtags

#baiduai #paddlepaddle #ernie #paddleocr #visionlanguage #ai #ocr