Find similar content

Source channel @githubtrending · Post #15428 · Jan 22

#cplusplus FlashMLA is DeepSeek's optimized attention library that makes AI models run faster and use less memory. It works with advanced NVIDIA GPUs to speed up how language models process information, achieving up to 660 trillion floating-point operations per second. The library supports both dense and sparse attention modes, meaning it can focus on important tokens while skipping less relevant ones, reducing computational waste. For you, this means faster AI responses, lower costs for running large language models, and better performance on tasks like chatbots and code generation. The technology is open-source and integrates with popular AI frameworks like PyTorch and Hugging Face, making it accessible for developers building next-generation AI applications. https://github.com/deepseek-ai/FlashMLA

Hashtags

#cplusplus

Results

3 similar posts found

Search: #agentmode

当前筛选 #agentmode清除筛选

Android Broadcast

@android_broadcast · Post #9938 · 04/02/2026, 02:57 PM

Find similar View

🔨Вышла Android Studio Panda 3 В новом стабильном релизе Android Studio два изменения, которые напрямую влияют на работу с Agent Mode. Первое — собственные Agent Skills. Создаёшь папку .skills/ в корне проекта, кладёшь туда SKILL.md с описанием нужного воркфлоу, и агент начинает использовать его автоматически. Можно вызвать вручную через @имя. Скилл может содержать инструкции по код-ревью под ваши стандарты, информацию о внутренних библиотеках, любые кастомные практики команды. Концепция ровно та же, что в Claude Code с CLAUDE.md, только встроена прямо в Studio. Второе — гранулярные разрешения для AI. Агент явно запрашивает разрешение перед чтением файлов, запуском shell-команд и веб-запросами. Можно настроить постоянные исключения для доверенных операций, SSH-ключи всегда требуют явного OK. Плюс опциональный sandbox для полной изоляции. #AndroidStudio#AgentMode#AIdev

Hashtags

#androidstudio #agentmode #aidev

Machinelearning

@ai_machinelearning_big_data · Post #8825 · 10/21/2025, 05:49 PM

Find similar View

🌐 OpenAI представила Atlas - свой новый AI-браузер с памятью и режимом агента. Atlas полностью интегрирован с ChatGPT и работает на базе ChatGPT Search. Главная фишка - Agent Mode, который может самостоятельно перемещаться по сайтам, открывать страницы и выполнять задачи прямо в браузере. Можно запускать несколько вкладок с агентами одновременно. 🧠 Браузер также имеет постоянную память (Memory Recall), он запоминает контекст, прошлые действия и может продолжить с того места, где вы остановились. Atlas уже доступен для всех пользователей: Free, Plus, Pro, Go и Business. Для Enterprise и Education доступна бета-версия. 📱Доступен для MacOs. Версии для Windows, iOS и Android - в разработке. Скоро поделюсь результатами тестов и первыми впечатлениями от Agent Mode. @ai_machinelearning_big_data https://chatgpt.com/atlas #OpenAI#Atlas#ChatGPT#AIbrowser#AgentMode

Hashtags

#openai #atlas #chatgpt #aibrowser #agentmode

Android Broadcast

@android_broadcast · Post #9943 · 04/02/2026, 05:58 PM

Find similar View

⭐️Gemma 4 в Android Studio: локальный AI-агент на вашем компьютере Google представил Gemma 4 — новое семейство открытых моделей для сложных рассуждений и вызова инструментов. Главная цель: сделать локальный агентный ИИ стандартом на Android — от разработки до продакшена на смартфоне. Сейчас фокус на Android Studio. Gemma 4 работает полностью локально на вашем компьютере. Код не уходит в облако. Agent Mode в Android Studio с Gemma позволит вам делать 👉 рефакторинг легаси‑кода 👉 создание целого приложения или новых фич 👉 итеративное исправление ошибок (агент сам применяет правки) Без интернета, с полным контролем приватности и без оплаты за токены. ——— Gemma 4 бывает разного размера: от E2B (2 млрд параметров) до 31B. Требования зависят от модели: 👉E2B (2B) — 8 ГБ RAM, работает на CPU. Для базовых подсказок. 👉E4B (4B) — от 16 ГБ RAM. Идеальный баланс для большинства разработчиков. 👉7B–14B — от 16 ГБ (лучше 32 ГБ). Нужен GPU или мощный нейронный движок. 👉26B A4B / 31B — 32+ ГБ RAM. Только с квантованием или на профессиональных станциях. Для обладателей MacBook Pro с 32+ ГБ и чипом M Pro/Max открвается много интересного. На такой конфигурации вы комфортно запустите: 👉E4B (4B) — молниеносно 👉26B A4B — отличный уровень интеллекта 👉31B — с квантованием (потеря качества минимальна) Благодаря Unified Memory и оптимизации через Metal MacBook Pro часто эффективнее PC с дискретными видеокартами в том же классе памяти. ——— Gemma 4 в Android Studio делает локального агентного ассистента реальностью. Вы получаете современный AI для сложных задач без облаков и без счетов за API. Выбрать модель можно прямо в настройках Android Studio через LLM‑провайдера (LM Studio, Ollama и др.). Я пойду тестировать её, потому что локальный AI агент - это очень круто! 🔗 Источник - Android Dev Blog #Gemma4#AndroidDe#AndroidStudio#AgentMode

Hashtags

#gemma4 #androidde #androidstudio #agentmode