TGTGInsightаналитика telegramLIVE / telegram public index
← [404] — программирование

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @procode404 · Post #3910 · 9 янв.

​🐍Распознавание текста с изображения —[8:50] Python часто используют при разработке искусственного интеллекта, который, в свою очередь, умеет в компьютерное зрение. Это самое зрение позволяет программе искать и идентифицировать объекты на изображении (люди, животные или даже текст), без чего, естественно, никак не обойтись. В этом видео автор на практике показал, как с использованием EasyOCR считывать текст русского и английского языка с изображения, а после — записать его в файл. Перейти к просмотру #видео#python

Результаты

Найдено 1 похожих постов

Поиск: #idefics

当前筛选 #idefics清除筛选
GitHub Trends

@githubtrending · Post #15600 · 04.04.2026, 11:30

#python#apple_silicon#florence2#idefics#llava#llm#local_ai#mlx#molmo#paligemma#pixtral#vision_framework#vision_language_model#vision_transformer MLX-VLM lets you run, chat with, and fine-tune Vision Language Models (VLMs) plus audio/video models on your Mac using MLX—install easily with `pip install -U mlx-vlm`. Use CLI for quick text/image/audio generation (e.g., `mlx_vlm.generate --model ... --image photo.jpg`), Gradio UI for chats, Python scripts, or a FastAPI server with OpenAI-compatible endpoints supporting multi-images/videos. Features like TurboQuant cut KV cache memory by 76%, and LoRA/QLoRA fine-tuning works on consumer hardware. You benefit by experimenting with powerful multimodal AI locally—fast, memory-efficient, no cloud costs, perfect for Mac users tweaking models affordably. https://github.com/Blaizzy/mlx-vlm