TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #310 · 21.04

Поймал себя на том, что иногда мне нравится ездить на автомобиле, а иногда нет. Понятно, что чилить на автостраде это прикольно, а пробиваться через городские пробки — нет. Но я осознал, что иногда мне в городе вполне прикольно, а иногда нет. Я даже в пробках иногда стою спокойно. Начал рефлексировать, и понял: мне приятно ездить, когда я никуда не тороплюсь. Когда можно опоздать на 5-10-15 минут, а то и на полчаса. В гости к друзьям обычно можно опоздать. В магазин можно опоздать, если ты не под закрытие едешь. А вот если едешь на какое-то мероприятие ко времени, то опаздывать нельзя, и обычно даже 10 минут неприятны. Дорожная ситуация меняется не слишком предсказуемо. Время на поиск места парковки тоже не определено. Да и постоянное искушение где-то что-то нарушить, чтобы не опоздать. Либо наоборот — выезжаешь на машине сильно заранее, и на месте просто ждёшь полчаса. В общем, машина хорошо решает задачу "Добраться куда-то в место, плохо доступное другими видами транспорта". Но не слишком хорошо решает задачу "Добраться куда-то к заданному моменту с точностью плюс-минус 5 минут". А, например, пешком + метро решает хорошо. Можно, конечно, пофантазировать на тему какого-то предсказания и правильного планирования, но на деле пара забитых перекрёстков вполне могут стоить вам 10 минут, что в контексте городской жизни довольно много. P.S. Скоро у меня отпуск, и будут очень интересные посты про дроны и мототехнику. Хотя погода в Питере как обычно норовит подвести в самое неподходящее время. С таким климатом хоть на автомобиле езди! #life

Hashtags

Резултати

Намерени 4 подобни публикации

Търсене: #minicpm

当前筛选 #minicpm清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8373 · 27.08.2025 г., 12:03

🌟MiniCPM-V 4.5: компактная модель, которая бьет гигантов в мультимодальном ИИ. Проект OpenBMB выпустил MiniCPM-V 4.5, мультимодальную модель на основе Qwen3-8B и SigLIP2-400M для распознавания изображений, серий изображений и видео, которая может работать на мобильных устройствах на более чем 30 языках. OpenBMB - некоммерческое подразделение китайской технологической компании ModelBest, под патронажем Университета Цинхуа. Среди инвесторов материнской ModelBest - Habo (Huawei), Primavera Capital Group и государственный Shenzhen Guozhong Venture Capital Management. 🟡Киллер-фича модели - эффективная работа с видео. Благодаря унифицированному 3D-Resampler модель сжимает видео в 96 раз: шесть кадров разрешением 448x448 преобразуются всего в 64 токена, тогда как большинству MLLM для этого потребовалось бы 1536 токенов. Это позволяет обрабатывать видео с частотой кадров до 10 FPS и длинные ролики без роста вычислительных затрат, что подтверждается топовыми результатами на наборах Video-MME, LVBench и MLVU. Архитектура LLaVA-UHD позволяет модели работать с изображениями до 1,8 мегапикселей и любым соотношением сторон, используя в 4 раза меньше визуальных токенов. Модель предлагает гибкий режим работы: быстрый ризонинг для повседневных задач и глубокий для сложных сценариев, переключаемый по требованию. При общем объеме в 8 млрд. параметров, MiniCPM-V 4.5 набирает 77.0 баллов по комплексному бенчу OpenCompass. Этот результат не просто улучшает предыдущие версии, модель превосходит GPT-4o-latest и Gemini-2.0 Pro, обходит открытую Qwen2.5-VL с 72 миллиардами параметров и устанавливает новый стандарт для общего MLLM на OmniDocBench. 🟡С инференсом тоже нет проблем. Доступны варианты для CPU через llama.cpp и ollama, есть квантованные версии в форматах int4, GGUF и AWQ, поддержка бэкендов SGLang и vLLM, возможность дообучения через Transformers и LLaMA-Factory, а также WebUI и оптимизированное iOS-приложение. ▶️ Чтобы было проще разобраться во всех вариантах запуска, разработчики заботливо подготовили подробный cookbook. 📌Лицензирование: MiniCPM Model License. 🟡Модель 🟡Demo 🟡Сообщество в Discord 🖥GitHub @ai_machinelearning_big_data #AI#ML#MMLM#MiniCPM#OpenBMB

GitHub Trends

@githubtrending · Post #15421 · 18.01.2026 г., 12:00

#python#audio#deeplearning#minicpm#python#pytorch#speech#speech_synthesis#text_to_speech#tts#tts_model#voice_cloning VoxCPM is a free, open-source TTS tool that turns text into realistic speech without tokens, creating expressive audio that matches context and clones voices perfectly from just 3-10 seconds of sample. Download VoxCPM1.5 (800M params) from Hugging Face, install via pip, and use simple Python or CLI commands for fast synthesis (RTF 0.15 on RTX 4090) or fine-tuning your own voices. You benefit by easily making natural audiobooks, podcasts, clones, or apps with pro-quality sound—saving time and costs on voice work. https://github.com/OpenBMB/VoxCPM

GitHub Trends

@githubtrending · Post #14815 · 10.06.2025 г., 11:30

#jupyter_notebook#chatglm#chatglm3#gemma_2b_it#glm_4#internlm2#llama3#llm#lora#minicpm#q_wen#qwen#qwen1_5#qwen2 This guide helps beginners set up and use open-source large language models (LLMs) on Linux or cloud platforms like AutoDL, with step-by-step instructions for environment setup, model deployment, and fine-tuning for models such as LLaMA, ChatGLM, and InternLM[2][4][5]. It covers everything from basic installation to advanced techniques like LoRA and distributed fine-tuning, and supports integration with tools like LangChain and online demo deployment. The main benefit is making powerful AI models accessible and easy to use for students, researchers, and anyone interested in experimenting with or customizing LLMs for their own projects[2][4][5]. https://github.com/datawhalechina/self-llm