Find similar content

Source channel @githubtrending · Post #15263 · Nov 2

#python#deep_learning#inference#llm#nlp#pytorch#transformer Nano-vLLM is a small, fast, and easy-to-understand tool for running large language models offline. It matches the speed of bigger systems like vLLM but uses only about 1,200 lines of clean Python code, making it simple to read and modify. It includes smart features like prefix caching and tensor parallelism to boost performance. You can install it easily and run models like Qwen3-0.6B on your own GPU. This tool is great if you want fast, efficient AI inference without complex setups, ideal for learning, research, or small deployments on limited hardware. https://github.com/GeeeekExplorer/nano-vllm

Hashtags

#python #deep_learning #inference #llm #nlp #pytorch #transformer

Results

5 similar posts found

Search: #gemma4

当前筛选 #gemma4清除筛选

Android Broadcast

@android_broadcast · Post #9944 · 04/02/2026, 06:21 PM

Find similar View

Какую модель Gemma выбрать в зависимости от вашего железа. Размер оперативки указан для запуска Android Studio + Gemma локально. Как минимум стоит иметь запас по оперативки для комфортной работы, когда начнется сборка, По цифрам кажется очень интересным вариантом чтобы попробовать кодинг через CLI без IDE #AI#AndroidStudio#Gemma4

Hashtags

#ai #androidstudio #gemma4

Семён: Нейросети в каждый дом

@semasci · Post #1516 · 04/03/2026, 05:28 AM

Find similar View

🔥Google выпустила Gemma 4 — самую умную открытую модель на сегодня Если вы следите за open-source LLM, это важный релиз. Gemma 4 построена на тех же исследованиях, что и Gemini 3, но работает локально — на вашем железе. Почему стоит обратить внимание: 🧠Прорывной интеллект — для сложных рассуждений и агентных workflows 🌐Мультимодальность и 140+ языков «из коробки» 📄Огромный контекст — до 256K токенов 🛠Нативные функции для вызовов инструментов и автономных агентов 💻 Качественная генерация кода (офлайн) ⚖️Apache 2.0 — можно использовать в коммерческих проектах без ограничений Доступны 4 размера модели в Google AI Studio. Для локального использования скачайте веса на Hugging Face, Kaggle и Ollama. 👉Больше деталей #Gemma4#OpenSourceAI#LLM https://t.me/semasci

Hashtags

#gemma4 #opensourceai #llm

AI一线｜ShareCentre

@ShareCentre · Post #7154 · 04/03/2026, 02:34 AM

Find similar View

Google 发布 Gemma 4 开源模型：Apache 2.0 许可，31B 登顶 Arena AI 开源第三 Google DeepMind 于 4 月 2 日正式发布 Gemma 4，迄今最强大的开源模型家族。基于与 Gemini 3 相同的技术构建，专为高级推理和 Agent 工作流打造。全系列首次采用 Apache 2.0 开源许可，完全商用自由。自初代发布以来，Gemma 已被下载超过 4 亿次，社区衍生出 10 万+变体。 ⚙️ 四款模型 - E2B（Effective 2B）：手机/IoT 边缘设备，128K 上下文，支持文本+图像+视频+音频 - E4B（Effective 4B）：手机/IoT 边缘设备，128K 上下文，支持文本+图像+视频+音频 - 26B MoE（混合专家）：推理时仅激活 3.8B 参数，256K 上下文，Arena AI 开源第 6 - 31B Dense（稠密）：最大化质量，256K 上下文，Arena AI 开源第 3，超越 20 倍参数量模型 🔑 核心能力 - 高级推理：多步规划与深度逻辑 - Agent 工作流：原生函数调用、结构化 JSON 输出、系统指令 - 代码生成：高质量离线代码，本地 AI 编程助手 - 多模态：全系列处理图像和视频，E2B/E4B 额外支持音频 - 140+ 语言原生训练 - Apache 2.0 许可：完全商用自由 📎 相关链接官方博客：https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/ Google AI Studio：https://aistudio.google.com Hugging Face：https://huggingface.co/collections/google/gemma-4 Kaggle：https://www.kaggle.com/models?query=gemma-4&publisher=google #Google#Gemma4#开源模型#ApacheLicense#AI

Hashtags

#google #gemma4 #开源模型 #apachelicense #ai

Android Broadcast

@android_broadcast · Post #9943 · 04/02/2026, 05:58 PM

Find similar View

⭐️Gemma 4 в Android Studio: локальный AI-агент на вашем компьютере Google представил Gemma 4 — новое семейство открытых моделей для сложных рассуждений и вызова инструментов. Главная цель: сделать локальный агентный ИИ стандартом на Android — от разработки до продакшена на смартфоне. Сейчас фокус на Android Studio. Gemma 4 работает полностью локально на вашем компьютере. Код не уходит в облако. Agent Mode в Android Studio с Gemma позволит вам делать 👉 рефакторинг легаси‑кода 👉 создание целого приложения или новых фич 👉 итеративное исправление ошибок (агент сам применяет правки) Без интернета, с полным контролем приватности и без оплаты за токены. ——— Gemma 4 бывает разного размера: от E2B (2 млрд параметров) до 31B. Требования зависят от модели: 👉E2B (2B) — 8 ГБ RAM, работает на CPU. Для базовых подсказок. 👉E4B (4B) — от 16 ГБ RAM. Идеальный баланс для большинства разработчиков. 👉7B–14B — от 16 ГБ (лучше 32 ГБ). Нужен GPU или мощный нейронный движок. 👉26B A4B / 31B — 32+ ГБ RAM. Только с квантованием или на профессиональных станциях. Для обладателей MacBook Pro с 32+ ГБ и чипом M Pro/Max открвается много интересного. На такой конфигурации вы комфортно запустите: 👉E4B (4B) — молниеносно 👉26B A4B — отличный уровень интеллекта 👉31B — с квантованием (потеря качества минимальна) Благодаря Unified Memory и оптимизации через Metal MacBook Pro часто эффективнее PC с дискретными видеокартами в том же классе памяти. ——— Gemma 4 в Android Studio делает локального агентного ассистента реальностью. Вы получаете современный AI для сложных задач без облаков и без счетов за API. Выбрать модель можно прямо в настройках Android Studio через LLM‑провайдера (LM Studio, Ollama и др.). Я пойду тестировать её, потому что локальный AI агент - это очень круто! 🔗 Источник - Android Dev Blog #Gemma4#AndroidDe#AndroidStudio#AgentMode

Hashtags

#gemma4 #androidde #androidstudio #agentmode

秀儿の科技软件|资源分享社🎀

@JianjiaoPD · Post #10759 · 04/07/2026, 03:13 PM

Find similar View

✈️ Gemma 4 | 谷歌刚发布免费、本地、能看图写代码且能在手机上运行的AI 模型 🏷 检索标签：#Gemma4#本地AI#AI#GoogleAIEdgeGallery#LocallyAI ⭐️ 详情介绍：Gemma 4 可以粗暴理解成一个能装进自己设备里的本地 AI 模型不用联网，不用注册，不用付费，聊天记录全在本地，谁也看不到谷歌这次发布了Gemma 4四个版本：E2B、E4B、31B 和 26B A4B [🔗详情获悉 ] 你只需要记其中两个模型E2B、E4B 这俩能在手机上使用安卓建议选 E4B iPhone 建议选 E2B（更省内存）如果你是17 Pro/Max/Air也可以试试 E4B 苹果端还可以试试 Locally AI：对 A 系列和 M 系列芯片做了专门优化，支持 Llama、Gemma、Qwen、DeepSeek 这些主流模型，全离线、无登录、无数据采集 Google AI Edge Gallery： 🍏App Store ·🎮Google Play Locally AI： 🍏App Store · Locally AI 😌频道 |🙂群聊 |😋中文包 |☺️搜索

Hashtags

#gemma4 #本地ai #ai #googleaiedgegallery #locallyai