TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #508 · 19.08

Традиционно полёт на коптере сравнивают с птицей или, например, подъёмом на высокое место и обзором оттуда. Пока я летал в горах, мне пришло в голову другое сравнение — выход из тела. Это ощущение есть именно в FPV-очках — твоё физическое тело как бы теряет материальность, потому что, помимо зрения, которое теперь идёт из камеры коптера, ты ещё и концентрируешься на управлении, из-за чего чувствуешь только кончики пальцев на стиках. Это очень любопытно: технологии позволяют вполне реально переживать то, что до этого было описано, как эзотерическая практика, весьма далёкая от науки и объективности. Постарался сделать это видео расслабляющим. Переключите плеер в высокое качество и не забудьте звук. #drone#travel#hobby https://www.youtube.com/watch?v=Prz2c3z73tE&r=3

Резултати

Намерени 2 подобни публикации

Търсене: #llava

当前筛选 #llava清除筛选
Илья AGI TV 🤖

@ilia_plasma · Post #148 · 08.10.2023 г., 12:16

Пока весь мир ждет доступа к новой модели со зрением GPT-4V(ision), опенсорс команда (пара азитов со степенью PhD из американских вузов) уже выпустили свой аналог и бесплатную версию #LLaVA (Large Language and Vision Assistant), которая выдает результат (не) хуже GPT4V и может работать локально. Вот такая скорость развития и конкуренции в этом новом #AI рынке. 🧠LLava - вебсайт 📄WhitePaper 🧬Github code 🔋Demo для потестить на своих дикпиках 🦒Colab (для запуска у себя на серваке)

Hashtags

GitHub Trends

@githubtrending · Post #15600 · 04.04.2026 г., 11:30

#python#apple_silicon#florence2#idefics#llava#llm#local_ai#mlx#molmo#paligemma#pixtral#vision_framework#vision_language_model#vision_transformer MLX-VLM lets you run, chat with, and fine-tune Vision Language Models (VLMs) plus audio/video models on your Mac using MLX—install easily with `pip install -U mlx-vlm`. Use CLI for quick text/image/audio generation (e.g., `mlx_vlm.generate --model ... --image photo.jpg`), Gradio UI for chats, Python scripts, or a FastAPI server with OpenAI-compatible endpoints supporting multi-images/videos. Features like TurboQuant cut KV cache memory by 76%, and LoRA/QLoRA fine-tuning works on consumer hardware. You benefit by experimenting with powerful multimodal AI locally—fast, memory-efficient, no cloud costs, perfect for Mac users tweaking models affordably. https://github.com/Blaizzy/mlx-vlm