TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15521 · Feb 25

#rust#ai_gateway#ai_gateway_support#envoy#envoyproxy#gateway#generative_ai#llm_gateway#llm_inference#llm_proxy#llm_routing#llmops#llms#openai#prompt#proxy#proxy_server#routing Plano is an AI-native proxy server that handles key tasks for agentic apps like routing between agents, smart LLM model selection, safety guardrails, and automatic traces for observability. Define agents in simple YAML, write basic HTTP code in any language, and start Plano to run multi-agent systems without custom plumbing or framework lock-in. You benefit by building and shipping reliable agents to production much faster, focusing on core logic while gaining safety, low latency, and easy scaling. https://github.com/katanemo/plano

Results

18 similar posts found

Search: #gemma

当前筛选 #gemma清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9801 · 04/02/2026, 04:34 PM

🚀Gemma 4 - новое семейство открытых моделей Google, которые можно запускать прямо на своём железе. Модели заточены для сложного reasoning и агентных задач. 🔵Доступны в четырёх вариантах: • 31B Dense и 26B MoE Топовый уровень производительности для сложных локальных задач: кастомные код-ассистенты, анализ научных данных и не только. • E4B и E2B (Edge) Оптимизированы для мобильных устройств — работают в реальном времени с текстом, изображениями и аудио. 🤖Что можно делать: • строить автономных ИИ-агентов • планировать и выполнять многошаговые задачи • взаимодействовать с приложениями • искать данные и вызывать API 👉 Встроенная работа с инструментами (tool use) из коробки. 🧠Контекст до 256K токенов: • анализ целых кодовых баз • длинные цепочки действий без потери контекста • стабильная работа в сложных сценариях ⚡️ Начать можно уже сейчас через Google AI Studio Также веса моделей доступны на Hugging Face, Kaggle и Ollama. Лицензия: Apache 2.0! Blog: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/ GGUFs: https://huggingface.co/collections/unsloth/gemma-4 Guide: https://unsloth.ai/docs/models/gemma-4 @ai_machinelearning_big_data #Gemma

Hashtags

ForgetMe | Нейросети

@forgetmeai · Post #4992 · 08/15/2025, 07:30 AM

📛Google представила Gemma 3 270M — ультракомпактную LLM Google выпустила Gemma 3 270M — одну из самых маленьких моделей в индустрии (270 млн параметров, а не миллиардов). Её можно запускать даже на слабых устройствах, а в INT4-квантизации на Pixel 9 Pro она расходует всего 0,75% батареи за 25 диалогов. Несмотря на размер, модель показывает достойные результаты: на IF-Eval её показатель следования инструкциям — 51,2%, что выше, чем у Qwen 2.5 0.5B, который почти вдвое больше. 📂 Веса: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d 📄 Блог Google: https://developers.googleblog.com/en/introducing-gemma-3-270m/ 🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI #новости#нейросети#gemma

Корпорация Google выпустила три новые модели генеративного искусственного интеллекта c открытым исходным кодом, позиционируя их как более «безопасные, компактные и прозрачные» по сравнению с другими. ▫️ Gemma 2 2B — версия модели с 2 млрд параметров, отличается улучшениями в области безопасности, предлагает «баланс производительности и эффективности»; ▫️ ShieldGemma — созданный на основе Gemma 2 комплект нейросетей для классификации безопасного контента; ▫️ Gemma Scope — новый инструмент для интерпретации моделей, который позволяет получить представление об их внутреннем устройстве. #Google#Gemma

NEWS 鏈新聞-ABMedia

@abmedia_news · Post #23692 · 04/07/2026, 05:31 AM

【🚀AI 人工智慧|Google 推出 Gemma 4:四種規格、Apache 2.0 授權、從手機到伺服器全覆蓋 】 #Google#Gemma 📍請見報導: https://abmedia.io/google-gemma-4-four-sizes-apache-2-multimodal-agent 📍訂閱鏈新聞頻道:https://linktr.ee/abmedia.io

NEWS 鏈新聞-ABMedia

@abmedia_news · Post #23636 · 04/03/2026, 03:32 AM

【🚀AI 人工智慧|Google 推出 Gemma 4 開源模型:「本地端推理」強化 AI 代理工作流效率 】 #Google#Gemma 📍請見報導: https://abmedia.io/google-gemma-4-introduction 📍訂閱鏈新聞頻道:https://linktr.ee/abmedia.io

ForgetMe | Нейросети

@forgetmeai · Post #6077 · 05/06/2026, 04:02 PM

✴️Google выпустила MTP-drafters для Gemma 4 — ускорение до 3x без потери качества Google представила Multi-Token Prediction drafters для семейства Gemma 4. Это небольшие вспомогательные модели для speculative decoding, которые заранее предлагают несколько следующих токенов, а основная модель затем проверяет их за один проход. По заявлению Google, такой подход дает ускорение инференса до 3 раз и при этом не ухудшает качество, точность и логику рассуждений. Практически это значит, что Gemma 4 становится заметно быстрее в локальном запуске, агентных сценариях и on-device задачах. Google отдельно пишет про поддержку разных стеков и платформ: Transformers, MLX, vLLM, SGLang, Ollama, а сами MTP-drafters уже доступны под той же Apache 2.0 лицензией, что и Gemma 4, с загрузкой через Hugging Face и Kaggle. Источник: блог Google | Документация | Hugging Face 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#llm#gemma

Yummy 😋

@godlynews1 · Post #15131 · 04/02/2026, 04:30 PM

谷歌公司推出Gemma 4开源模型,为高级推理打造Gemma 4 英伟达与谷歌公司致力于为英伟达GPUs优化Gemma 4 英伟达为本地智能体人工智能(Agentic AI)加速Gemma 4 🗒 标签: #Google#Gemma#英伟达 📢 频道: @GodlyNews1 🤖 投稿: @GodlyNewsBot

智能视界

@AITimes365 · Post #103 · 02/23/2024, 04:26 AM

#境外AI#Google#Gemma Google Gemma开放模型正式发布! 官网介绍:https://ai.google.dev/gemma?hl=zh-cn 详细介绍:https://huggingface.co/blog/zh/gemma

Закиев Василь. (AI)ron manager

@zvasilchannel · Post #2308 · 04/10/2026, 05:45 AM

GPT-4 стоил $30 за миллион токенов. Gemma 4 сейчас стоит — $0.14. Разница в 214 раз. Падение цен на интеллект на два с лишним порядка всего за два года. Google выпустил Gemma 4 — open-source, 31 млрд параметров, 256K контекст. Бенчмарки в лоб с GPT-4o: — MMLU: Gemma 4 92.4% vs GPT-4o 88.7% — HumanEval (код): 94.1% vs 90.2% — GSM8K (математика): 96.2% vs 95.0% Два года назад GPT-4 был фронтиром за $30. Сейчас open-source бьёт его по бенчмаркам за $0.14. Падение в 214 раз — больше, чем закон Мура даёт за десятилетие. А можно развернуть локально — и не платить вообще. Обойдётся ещё раз в пять дешевле. Но парадокс: цена за токен падает в сотни раз, а мой счёт за AI растёт. $200/мес подписки раньше хватало с избытком. Сейчас заканчивается быстрее чем за неделю, потому что через AI идёт всё — код, тексты, анализ, контент. Инференс дешевеет быстро. Но аппетит к нему растёт быстрее. tokencost.app/blog/gemma-4-pricing-benchmarks #инференс#gemma

Machinelearning

@ai_machinelearning_big_data · Post #8276 · 08/14/2025, 06:03 PM

⚡ Google представила Gemma 3 270M — свою новую компактную модель Модель 270 млн параметров (170M для эмбеддингов и 100M для трансформер-блоков), но с отличной способностью следовать промтпам прямо «из коробки». 🔹Особенности - 256k токенов - Энергоэффективность: INT4-версия на Pixel 9 Pro расходует всего 0.75% батареи за 25 диалогов. - Доступны предобученные и instruction-tuned чекпойнты. - Поддержка Quantization-Aware Training (QAT) для запуска в INT4 без заметной потери качества. 💼Когда использовать - Массовые, чётко определённые задачи: анализ тональности, извлечение сущностей, обработка текста, комплаенс-проверки. - Минимальные задержки и низкая стоимость инференса — можно запускать прямо на устройстве. - Быстрые эксперименты с fine-tuning. - Полная приватность данных благодаря on-device работе. - Создание «флота» узкоспециализированных моделей. В анонсе приводится пример, как Adaptive ML и SK Telecom дообучили Gemma 3 4B для мультиязычной модерации контента, превзойдя более крупные проприетарные модели. Gemma 3 270M — отличная небольшая модель, быстрая и дешёвая в работе. 🟠Подробности: https://developers.googleblog.com/en/introducing-gemma-3-270m/ 🟠HF: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d @ai_machinelearning_big_data #news#ai#ml#Gemma#google

科技&趣闻&杂记

@kejiqu · Post #4320 · 04/03/2026, 12:18 AM

谷歌发布 Gemma 4 开源大模型,31B 参数性能达头部水准 谷歌今日正式发布Gemma 4大模型,据称是迄今为止谷歌最智能的开源模型,专为高级推理与智能体工作流打造。本次共推出四种规格:高效20亿参数版(E2B)、高效40亿参数版(E4B)、260亿混合专家模型(MoE)与310亿稠密模型(31B)。其中,31B模型在Arena AI文本榜单中位列全球开源模型第三,26B模型位居第六。E2B与E4B模型可在手机、树莓派、英伟达Jetson Orin Nano等端侧设备上完全离线运行。Gemma 4具备高级推理、智能体工作流、代码生成、视觉与音频处理等核心优势,支持140+种语言,端侧模型上下文窗口达128K,大模型最高支持256K。26B MoE模型推理时仅激活38亿参数,实现低延迟。IT之家 🏷#Gemma#大模型#开源#AI 📢频道👥群组📝投稿

12
PreviousPage 1 of 2Next