TGTGInsighttelegram intelligenceLIVE / telegram public index
← Linuxgram 🐧

TGINSIGHT SIMILAR POSTS

Sib kontenut simili

Kanal tas-sors @linuxgram · Post #17841 · Fra 19

📰 AI Helped Uncover A "50-80x Improvement" For Linux's IO_uring Linux block maintainer and IO_uring lead developer Jens Axboe recently was debugging some slowdowns in the AHCI/SCSI code with IO_uring usage. When turning to Claude AI to help in sorting through the issue, patches were devised that can deliver up to a "literally yield a 50-80x improvement on the io_uring side for idle systems." The code is on its way to the Linux kernel... 🔗 Source: https://www.phoronix.com/news/AI-50-80x-IO-uring #linux#kernel

Riżultati

1 post simili nstab

Tfittxija: #litert

当前筛选 #litert清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8689 · 04/10/2025 15:05

✔️GenAI прямо на устройстве: Chrome, Chromebook Plus и Pixel Watch с LiteRT-LM Google выпустили LiteRT-LM - фреймворк для запуска LLM прямо на устройстве (offline), с минимальной задержкой и без API-вызовов. Если вы пилите приложения, это полезная штука, потому что: - Работает на устройстве: нет задержек от удалённых серверов - Нет расходов на API - Дает доступ к Локальному GenAI 🔍 Основное - LiteRT-LM уже используется внутри Gemini Nano / Gemma в Chrome, Chromebook Plus и Pixel Watch. - Открытый C++ интерфейс (preview) для интеграции в кастомные решения. - Архитектура: Engine + Session • Engine хранит базовую модель, ресурсы - общий для всех функций • Session - контекст для отдельных задач, с возможностью клонирования, копирования “по записи” (Copy-on-Write) и лёгких переключений - Поддержка аппаратного ускорения (CPU / GPU / NPU) и кроссплатформенность (Android, Linux, macOS, Windows и др.) - Для Pixel Watch используется минимальный “pipeline” - только необходимые компоненты - чтобы уложиться в ограничения памяти и размера бинарей Google опенсорснули целый стек для запуска GenAI на устройствах: - LiteRT быстрый «движок», который запускает отдельные AI-модели на устройстве. - LiteRT-LM - интерфейс C++ для работы с LLM. Он объединяет сразу несколько инстурментов : кэширование промптов, хранение контекста, клонирование сессий и т.д. - LLM Inference API - готовые интерфейсы для разработчиков (Kotlin, Swift, JS). Работают поверх LiteRT-LM, чтобы можно было легко встраивать GenAI в приложения. 🟠Подробнее: https://developers.googleblog.com/en/on-device-genai-in-chrome-chromebook-plus-and-pixel-watch-with-litert-lm/ @ai_machinelearning_big_data #AI#Google#LiteRT#LiteRTLM#GenAI#EdgeAI#OnDeviceAI#LLM