TGTGInsighttelegram intelligenceLIVE / telegram public index

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #425 · 20 апр.

Недавно делал быстрый прототип асинхронного приложения в котором требовалось вызывать много синхронного кода. Да, я знаю, что это не лучший дизайн, но нужно было быстрое решение на один процесс и без очередей. Поэтому я выполнял код в потоках. Выглядело это примерно так: from fastapi.concurrency import run_in_threadpool async def execute(data: DataRequest) -> DataResponse: try: result = await run_in_threadpool(sync_function, data) return DataResponse(data=result) except Exception as e: return DataResponse( error=str(e), success=False, ) В общем работает нормально. Для всех вызовов под капотом используется общий тредпул, всё работает предсказуемо. Но потребовалось изменить количество запускаемых в пуле потоков (по умолчанию создается 40 воркеров). Так как дело происходит с FastAPI, делается это через lifespan используя настройки anyio: import anyio @asynccontextmanager async def lifespan(app: FastAPI): limiter = anyio.to_thread.current_default_thread_limiter() limiter.total_tokens = 100 yield # если вдруг нужно вернуть обратно limiter.total_tokens = 40 Зачем менять количество воркеров? - уменьшить, если оперативки мало (один тред занимает ~8мб) - увеличить чтобы выдержать нагрузку Если есть предложения получше при тех же вводных - предлагайте😉 #async

Hashtags

#async

Резултати

Пронајдени 18 слични објави

Пребарај: #gemma

当前筛选 #gemma清除筛选

Machinelearning

@ai_machinelearning_big_data · Post #9801 · 02.04.2026 г., 16:34

Најди слично Погледај

🚀Gemma 4 - новое семейство открытых моделей Google, которые можно запускать прямо на своём железе. Модели заточены для сложного reasoning и агентных задач. 🔵Доступны в четырёх вариантах: • 31B Dense и 26B MoE Топовый уровень производительности для сложных локальных задач: кастомные код-ассистенты, анализ научных данных и не только. • E4B и E2B (Edge) Оптимизированы для мобильных устройств — работают в реальном времени с текстом, изображениями и аудио. 🤖Что можно делать: • строить автономных ИИ-агентов • планировать и выполнять многошаговые задачи • взаимодействовать с приложениями • искать данные и вызывать API 👉 Встроенная работа с инструментами (tool use) из коробки. 🧠Контекст до 256K токенов: • анализ целых кодовых баз • длинные цепочки действий без потери контекста • стабильная работа в сложных сценариях ⚡️ Начать можно уже сейчас через Google AI Studio Также веса моделей доступны на Hugging Face, Kaggle и Ollama. Лицензия: Apache 2.0! Blog: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/ GGUFs: https://huggingface.co/collections/unsloth/gemma-4 Guide: https://unsloth.ai/docs/models/gemma-4 @ai_machinelearning_big_data #Gemma

Hashtags

#gemma

ForgetMe | Нейросети

@forgetmeai · Post #4992 · 15.08.2025 г., 07:30

Најди слично Погледај

📛Google представила Gemma 3 270M — ультракомпактную LLM Google выпустила Gemma 3 270M — одну из самых маленьких моделей в индустрии (270 млн параметров, а не миллиардов). Её можно запускать даже на слабых устройствах, а в INT4-квантизации на Pixel 9 Pro она расходует всего 0,75% батареи за 25 диалогов. Несмотря на размер, модель показывает достойные результаты: на IF-Eval её показатель следования инструкциям — 51,2%, что выше, чем у Qwen 2.5 0.5B, который почти вдвое больше. 📂 Веса: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d 📄 Блог Google: https://developers.googleblog.com/en/introducing-gemma-3-270m/ 🤑ForgetMe | Boosty | ForgetBench | ForgetGPT | ForgetAPI #новости#нейросети#gemma

Hashtags

#новости #нейросети #gemma

ИИ AI Нейротех | Искусственный Интеллект

@the_ai · Post #807 · 01.08.2024 г., 12:39

Најди слично Погледај

Корпорация Google выпустила три новые модели генеративного искусственного интеллекта c открытым исходным кодом, позиционируя их как более «безопасные, компактные и прозрачные» по сравнению с другими. ▫️ Gemma 2 2B — версия модели с 2 млрд параметров, отличается улучшениями в области безопасности, предлагает «баланс производительности и эффективности»; ▫️ ShieldGemma — созданный на основе Gemma 2 комплект нейросетей для классификации безопасного контента; ▫️ Gemma Scope — новый инструмент для интерпретации моделей, который позволяет получить представление об их внутреннем устройстве. #Google#Gemma

Hashtags

#google #gemma

NEWS 鏈新聞-ABMedia

@abmedia_news · Post #23692 · 07.04.2026 г., 05:31

Најди слично Погледај

【🚀AI 人工智慧｜Google 推出 Gemma 4：四種規格、Apache 2.0 授權、從手機到伺服器全覆蓋】 #Google#Gemma 📍請見報導： https://abmedia.io/google-gemma-4-four-sizes-apache-2-multimodal-agent 📍訂閱鏈新聞頻道：https://linktr.ee/abmedia.io

Hashtags

#google #gemma

NEWS 鏈新聞-ABMedia

@abmedia_news · Post #23636 · 03.04.2026 г., 03:32

Најди слично Погледај

【🚀AI 人工智慧｜Google 推出 Gemma 4 開源模型：「本地端推理」強化 AI 代理工作流效率】 #Google#Gemma 📍請見報導： https://abmedia.io/google-gemma-4-introduction 📍訂閱鏈新聞頻道：https://linktr.ee/abmedia.io

Hashtags

#google #gemma

ForgetMe | Нейросети

@forgetmeai · Post #6077 · 06.05.2026 г., 16:02

Најди слично Погледај

✴️Google выпустила MTP-drafters для Gemma 4 — ускорение до 3x без потери качества Google представила Multi-Token Prediction drafters для семейства Gemma 4. Это небольшие вспомогательные модели для speculative decoding, которые заранее предлагают несколько следующих токенов, а основная модель затем проверяет их за один проход. По заявлению Google, такой подход дает ускорение инференса до 3 раз и при этом не ухудшает качество, точность и логику рассуждений. Практически это значит, что Gemma 4 становится заметно быстрее в локальном запуске, агентных сценариях и on-device задачах. Google отдельно пишет про поддержку разных стеков и платформ: Transformers, MLX, vLLM, SGLang, Ollama, а сами MTP-drafters уже доступны под той же Apache 2.0 лицензией, что и Gemma 4, с загрузкой через Hugging Face и Kaggle. Источник: блог Google | Документация | Hugging Face 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#llm#gemma

Hashtags

#нейросети #llm #gemma

Yummy 😋

@godlynews1 · Post #15131 · 02.04.2026 г., 16:30

Најди слично Погледај

谷歌公司推出Gemma 4开源模型，为高级推理打造Gemma 4 英伟达与谷歌公司致力于为英伟达GPUs优化Gemma 4 英伟达为本地智能体人工智能（Agentic AI）加速Gemma 4 🗒 标签: #Google#Gemma#英伟达 📢 频道: @GodlyNews1 🤖 投稿: @GodlyNewsBot

Hashtags

#google #gemma #英伟达

智能视界

@AITimes365 · Post #103 · 23.02.2024 г., 04:26

Најди слично Погледај

#境外AI#Google#Gemma Google Gemma开放模型正式发布！官网介绍：https://ai.google.dev/gemma?hl=zh-cn 详细介绍：https://huggingface.co/blog/zh/gemma

Hashtags

#境外ai #google #gemma

Закиев Василь. (AI)ron manager

@zvasilchannel · Post #2308 · 10.04.2026 г., 05:45

Најди слично Погледај

GPT-4 стоил $30 за миллион токенов. Gemma 4 сейчас стоит — $0.14. Разница в 214 раз. Падение цен на интеллект на два с лишним порядка всего за два года. Google выпустил Gemma 4 — open-source, 31 млрд параметров, 256K контекст. Бенчмарки в лоб с GPT-4o: — MMLU: Gemma 4 92.4% vs GPT-4o 88.7% — HumanEval (код): 94.1% vs 90.2% — GSM8K (математика): 96.2% vs 95.0% Два года назад GPT-4 был фронтиром за $30. Сейчас open-source бьёт его по бенчмаркам за $0.14. Падение в 214 раз — больше, чем закон Мура даёт за десятилетие. А можно развернуть локально — и не платить вообще. Обойдётся ещё раз в пять дешевле. Но парадокс: цена за токен падает в сотни раз, а мой счёт за AI растёт. $200/мес подписки раньше хватало с избытком. Сейчас заканчивается быстрее чем за неделю, потому что через AI идёт всё — код, тексты, анализ, контент. Инференс дешевеет быстро. Но аппетит к нему растёт быстрее. tokencost.app/blog/gemma-4-pricing-benchmarks #инференс#gemma

Hashtags

#инференс #gemma

Machinelearning

@ai_machinelearning_big_data · Post #8276 · 14.08.2025 г., 18:03

Најди слично Погледај

⚡ Google представила Gemma 3 270M — свою новую компактную модель Модель 270 млн параметров (170M для эмбеддингов и 100M для трансформер-блоков), но с отличной способностью следовать промтпам прямо «из коробки». 🔹Особенности - 256k токенов - Энергоэффективность: INT4-версия на Pixel 9 Pro расходует всего 0.75% батареи за 25 диалогов. - Доступны предобученные и instruction-tuned чекпойнты. - Поддержка Quantization-Aware Training (QAT) для запуска в INT4 без заметной потери качества. 💼Когда использовать - Массовые, чётко определённые задачи: анализ тональности, извлечение сущностей, обработка текста, комплаенс-проверки. - Минимальные задержки и низкая стоимость инференса — можно запускать прямо на устройстве. - Быстрые эксперименты с fine-tuning. - Полная приватность данных благодаря on-device работе. - Создание «флота» узкоспециализированных моделей. В анонсе приводится пример, как Adaptive ML и SK Telecom дообучили Gemma 3 4B для мультиязычной модерации контента, превзойдя более крупные проприетарные модели. Gemma 3 270M — отличная небольшая модель, быстрая и дешёвая в работе. 🟠Подробности: https://developers.googleblog.com/en/introducing-gemma-3-270m/ 🟠HF: https://huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d @ai_machinelearning_big_data #news#ai#ml#Gemma#google

Hashtags

#news #ai #ml #gemma #google

Ultimora.net - POLITICS

@ultimoraPOLITICS · Post #40089 · 22.06.2022 г., 11:26

Најди слично Погледај

#Italia Europarlamento, continua l'esodo a 5 stelle: #Rondinelli e #Gemma passano con Di Maio. Dei 14 eletti nel 2019, solamente in 5 sono attualmente nel #M5S. @UltimoraPolitics

Hashtags

#italia #rondinelli #gemma #m5s

科技&趣闻&杂记

@kejiqu · Post #4320 · 03.04.2026 г., 00:18

Најди слично Погледај

谷歌发布 Gemma 4 开源大模型，31B 参数性能达头部水准谷歌今日正式发布Gemma 4大模型，据称是迄今为止谷歌最智能的开源模型，专为高级推理与智能体工作流打造。本次共推出四种规格：高效20亿参数版（E2B）、高效40亿参数版（E4B）、260亿混合专家模型（MoE）与310亿稠密模型（31B）。其中，31B模型在Arena AI文本榜单中位列全球开源模型第三，26B模型位居第六。E2B与E4B模型可在手机、树莓派、英伟达Jetson Orin Nano等端侧设备上完全离线运行。Gemma 4具备高级推理、智能体工作流、代码生成、视觉与音频处理等核心优势，支持140+种语言，端侧模型上下文窗口达128K，大模型最高支持256K。26B MoE模型推理时仅激活38亿参数，实现低延迟。IT之家 🏷#Gemma#大模型#开源#AI 📢频道👥群组📝投稿

Hashtags

#gemma #大模型 #开源 #ai

← ПретходнаСтраница 1 од 2Следна →