⚡️Новая модель LFM2-2.6B - лидер в классе до 3B параметров. Ключевые особенности: - лёгкая и быстрая, всего 2.6B параметров - построена на архитектуре v2 (short convs + group query attention) - обучена на 10 трлн токенов, поддерживает контекст до 32k LFM2-2.6B - компактная, но мощная моделька для широкого спектра задач. 🟠Blog post: https://liquid.ai/blog/introducing-lfm2-2-6b-redefining-efficiency-in-language-models 🟠HF: https://huggingface.co/LiquidAI/LFM2-2.6B 🟠Model Bundle on LEAP: https://leap.liquid.ai/models?model=lfm2-2.6b @ai_machinelearning_big_data #AI#LLM#LFM2#OpenSourceAI#Multilingual

Hashtags

#ai #llm #lfm2 #opensourceai #multilingual

Machinelearning

@ai_machinelearning_big_data · Post #8198 · 03/08/2025 07:37

Trouver des similaires Voir

🌟Фреймворк **CUDA-L1** сам научился оптимизировать код для GPU — и добился в среднем **3.12× ускорения работы модели**, а в пике — **до 120×**. . Попросите любую LLM написать CUDA-код, и скорее всего, вы получите что-то, что либо не компилируется, либо работает мучительно медленно. Причина проста: качественного CUDA-кода в обучающих данных моделей почти не было. Чтобы исправить это досадное упущение, Deep Reinforce AI создали систему CUDA-L1, которая основана на трехэтапном пайплайне: сначала supervised-обучение для освоения основ, затем self-supervised для практики и, наконец, контрастное обучение с подкреплением, чтобы было все максимально быстро. 🟢На первом этапе система училась писать корректный и компилируемый CUDA-код. Для этого существующий код был аугментирован - создавались его вариации, чтобы повысить насмотренность модели. 🟢На втором этапе модель генерировала собственный CUDA-код, тестировала его и училась на работающих примерах, отсеивая неудачные. 🟢Самое интересное - третий этап. Обучаемой модели показывали несколько реализаций CUDA-ядер вместе с их показателями ускорения, например: «kernel_v1 дает ускорение 1.2x», «kernel_v2 — 2.8x», а «kernel_v3 — 1.5x». Затем задали 3 вопроса: 🟠Почему kernel_v2 настолько быстрее? 🟠Какая стратегия оптимизации сработает еще лучше? 🟠Напиши ядро, которое превзойдет их все. Таким образом, модель не гадает вслепую, а учится на конкретных примерах, анализируя причины разницы в производительности. 🟡Отдельная история - как победили reward hacking. После обучения выяснилось, что более 30% сгенерированных реализаций пытались сжульничать - создавали дополнительные CUDA-потоки, которые выполнялись асинхронно. Поскольку бенчмарк KernelBench отслеживал время только на основном потоке, код выглядел быстрее, чем был на самом деле, показывая фиктивное ускорение в 18 раз. Другие уловки состояли в манипуляции гиперпараметрами задачи (уменьшение batch_size или размерностей) и кеширование результатов вычислений. 🟡Пришлось строить многоуровневую защиту. Во-первых, в качестве "адвоката дьявола" взяли adversarial-чекер на базе DeepSeek-R1, который анализировал код на предмет эксплойтов с точностью обнаружения более 60%. Во-вторых, собрали базу данных из более чем 500 уникальных паттернов взлома, это повысило точность обнаружения на 25%. И в-третьих, применили математическое сглаживание и нормализацию наград, где любое подозрительное ускорение (от 1.5x для простых операций) дополнительно проверялось. 🟡После всех фильтров и проверок прогон на бенчмарке KernelBench оказался весьма позитивными. Система успешно сгенерировала рабочий код для 249 из 250 задач, причем в 240 случаях код оказался быстрее базовой реализации. Среднее ускорение по всем задачам составило 3.12 раза, максимальное - аж 120 раз. Медианное ускорение (50-й перцентиль) составило 1.42x, а 75-й перцентиль — 2.25x. Производительность по уровням сложности задач распределилась следующим образом: на простых операциях среднее ускорение составило 2.78x, на последовательностях операторов - 3.55x, а на сложных задачах вроде полных слоев трансформера - 2.96x. 🟡Самое важное - это переносимость оптимизаций. Код, оптимизированный на NVIDIA A100, был протестирован на других GPU. Результаты показали, что найденные паттерны оптимизации фундаментальны и работают на разных архитектурах. Среднее ускорение на H100 составило 2.39x (успешных ускорений 227 из 250), на L40 — 3.12x (228/248), а на потребительской RTX 3090 — 2.50x (213/242). ▶️ Пока веса и код не опубликованы, но в ожидании можно покрутить интерактивное демо и воспроизвести тесты из пейпера - в репозитории проекта есть фрагменты CUDA-кода с отдельными версиями для разных GPU. 📌Лицензирование: GPL-3.0 License. 🟡Страница проекта 🟡Arxiv 🟡Demo 🖥Github @ai_machinelearning_big_data #AI#ML#CUDA#DeepReinforce#ContrastiveRL

Hashtags

#ai #ml #cuda #deepreinforce #contrastiverl

BesnowCloud貝雪雲-公告頻道

@besnow_cloud · Post #2975 · 19/04/2025 16:06

Trouver des similaires Voir

🔊【#深度解读】当年一份“摩尔定律”预言，如何从硅谷实验室走进全球手机、AI、区块链的心脏？🔍 从指数翻倍到纳米光刻，每一步背后都藏着怎样的“炼金术”？✨#摩尔定律#芯片战争#AI#加密货币#ASML 👉阅读全文

Hashtags

#深度解读 #摩尔定律 #芯片战争 #ai #加密货币 #asml

Machinelearning

@ai_machinelearning_big_data · Post #8680 · 02/10/2025 17:01

Trouver des similaires Voir

✔️IBM представила Granite 4.0 — новое семейство open-weights языковых моделей от 3B до 32B параметров. Четыре новые модели: - Granite 4.0 H Small - 32B/9B активных параметров - Granite 4.0 H Tiny - 7B/1B - Granite 4.0 H Micro - 3B/3B - Granite 4.0 Micro - 3B/3B Benchmarking (Artificial Analysis Index): - Granite 4.0 H Small: 23 балла (на 8 выше Granite 3.3 8B), обходит Gemma 3 27B (22), но уступает Mistral Small 3.2 (29) и Qwen3 30B A3B (37). - Granite 4.0 Micro: 16 баллов, выше Gemma 3 4B (15) и LFM 2 2.6B (12). ⚡ Token efficiency: - Granite 4.0 Small — 5.2M токенов - Granite 4.0 Micro — 6.7M токенов Обе модели заметно эффективнее Granite 3.3 8B и большинства non-reasoning моделей <40B. Детали: - Контекст: до 128K токенов - Лицензия: Apache 2.0 - Granite 4.0 H Small доступна на Replicate по $0.06 / $0.25 за 1M input/output токенов - Все модели доступны на Hugging Face - Модель Micro (3.4B) можно запускать полностью локально. 🔗 Hugging Face: https://huggingface.co/collections/unsloth/granite-40-68ddf64b4a8717dc22a9322d 🔗Unsloth: https://docs.unsloth.ai/new/ibm-granite-4.0 @ai_machinelearning_big_data #AI#IBM#Granite4#LLM#OpenWeights

Hashtags

#ai #ibm #granite4 #llm #openweights

AI一线｜ShareCentre

@ShareCentre · Post #7114 · 23/03/2026 05:42

Trouver des similaires Voir

🔧 Shadify：用自然语言说出 UI，shadcn 组件实时生成 📌 项目简介 CopilotKit 开源新项目 Shadify，用户只需用自然语言描述想要的界面，即可实时生成基于 shadcn/ui 的交互式页面，并一键导出为干净的 React 代码。 - GitHub Star：105 - 开源协议：MIT - 主语言：TypeScript（91.8%） - 创建时间：2026-02-25 - 在线演示：https://shadify.copilotkit.ai ⚙️ 技术架构三服务 pnpm monorepo 架构： - UI（React + Vite）：聊天界面、组件渲染、代码导出 - Runtime（Hono + CopilotKit）：消息路由至 Agent - Agent（FastAPI + LangGraph）：推理、工具调用（Tavily 搜索/网页提取）、多轮对话记忆核心技术栈： - shadcn/ui — AI 从真实 shadcn 组件库中组合，生成的页面可直接 npx shadcn add 使用 - CopilotKit — 实时流式传输结构化 UI，将完整组件 schema 作为 Agent 上下文 - LangGraph — 驱动 Agent 后端，处理推理和工具调用 - Render — 单文件 render.yaml 一键部署三服务 📎 背景 CopilotKit 是开源 AI Agent 前端框架领域的领军项目，也是 AG-UI（Agent-User Interaction）协议的创建者。AG-UI 协议于 2025 年 5 月发布，已获 LangGraph、CrewAI、Mastra 等框架首日集成支持。CopilotKit 主仓库在 GitHub 累计超 20K Star，定位「企业级 Agent 前端技术栈」。近期 CopilotKit 还发布了 Open Generative UI 模板，灵感来自 Claude 的交互式图表功能，展示如何用 CopilotKit + LangGraph 构建 AI 驱动的动态 UI。Shadify 是其 Generative UI 能力的最佳实践案例，将「描述即生成」从文本扩展到完整 UI 组件页面。 💡 推荐理由 - 零门槛 UI 生成：自然语言描述 → 实时交互式 shadcn 页面，非前端开发者也能快速原型 - 代码可用：导出的 React 代码使用标准 shadcn 组件，可直接集成到现有项目 - 架构清晰：三服务分离 + pnpm monorepo，适合作为 Generative UI 学习参考 - 一键部署：Render Blueprint 配置，推送即上线 - 完全开源：MIT 协议，可自由商用 🔗 链接 - GitHub：https://github.com/CopilotKit/shadify #AI#开源项目#GenerativeUI#shadcn#CopilotKit#AIAgent

Hashtags

#ai #开源项目 #generativeui #shadcn #copilotkit #aiagent

Digital Princess

@digitalprincess · Post #310 · 16/06/2021 09:50

Trouver des similaires Voir

Сегодня на круглом столе "Искусственный интеллект: разумный партнер" XII Международного ИТ-Форума с участием стран БРИКС и ШОС представлен доклад "Этика и цифра: от проблем к решениям", в котором рассмотрено, в том числе и развитие оценки воздействия алгоритмических систем на международном уровне и ее перспективы в России. Доклад подготовлен нашими коллегами из #РАНХиГС@CDTO_online совместно с коллегами из @AI_regulation@GDPRru #ИИ#AI#digital#AIIA#TechnologyAssessment

Hashtags

#ранхигс #ии #ai #digital #aiia #technologyassessment

Ai Arts Gallery — Anime

@AiArtsGalleryAnime · Post #3933 · 04/04/2025 06:09

Trouver des similaires Voir

Ai Anime Girl — Lucyna Kushinada #Ai#AiArt#AiAnime#Art#Anime #Lucyna#Lucy

Hashtags

#ai #aiart #aianime #art #anime #lucyna #lucy

Ai Arts Gallery — Anime

@AiArtsGalleryAnime · Post #3869 · 27/03/2025 11:50

Trouver des similaires Voir

Ai Anime Girl — Lucyna Kushinada #Ai#AiArt#AiAnime#Art#Anime #Lucyna#Lucy

Hashtags

#ai #aiart #aianime #art #anime #lucyna #lucy

Machinelearning

@ai_machinelearning_big_data · Post #9789 · 01/04/2026 17:33

Trouver des similaires Voir

🌟 Holo3: SOTA-агентная модель для управления десктопными приложениями. Парижский стартап H Company выпустил семейство мультимодальных моделей Holo3, предназначенных для управления графическими интерфейсами. H Company (ранее Holistic AI) публично вышла на рынок в начале 2024 года. Основатели: Шарль Кантор, бывший исследователь Стэнфорда, и Лоран Сифр, ветеран Google DeepMind и один из ключевых участников проекта AlphaGo. Посевной раунд составил $220 млн - один из крупнейших в истории европейского венчура. Среди инвесторов: Эрик Шмидт, Юрий Мильнер, Бернар Арно, Ксавье Ньель, а также Amazon, Samsung и UiPath. 🟡Обе модели семейства на архитектуре Mixture-of-Experts Старшая Holo3-122B-A10B доступна только на платформе H Company по цене 40 центов за миллион входящих и 3 доллара за миллион выходных токенов. Младшая версия Holo3-35B-A3B выложена на Hugging Face под лицензией Apache 2.0 и также доступна бесплатно через Inference API с ограничением в 10 PRM. В платном режиме - 0,25/1.8 доллара за миллион входных/выходных токенов. 🟡Holo3 учили по замкнутому циклу из 3 стадий Сначала по заданным сценариям генерируются синтетические примеры навигации по интерфейсам. Затем данные расширяются за пределы исходных условий, чтобы модель учитывала нестандартные ситуации. На финальном этапе все примеры проходят курируемый отбор и обучение с подкреплением. Для тренировки H Company построила генератор синтетических корпоративных сред, в котором агенты создают веб-приложения по спецификациям сценариев, формируя верифицируемые задачи разной сложности. На базе этих сред разработан H Corporate Benchmarks - набор из 486 многошаговых задач в 4 категориях: электронная коммерция, бизнес-ПО, инструменты совместной работы и межприложенческие сценарии. Последние требуют координации между несколькими системами одновременно (скажем, извлечь цены из PDF, сопоставить их с бюджетами сотрудников и автоматически разослать персонализированные письма с одобрением или отказом). 🟡Тесты Флагманская Holo3-122B-A10B набрала 78,85% на бенчмарке OSWorld-Verified - это лучший результат на ведущем тесте взаимодействия с рабочим столом. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Модель @ai_machinelearning_big_data #AI#ML#MMLM#Holo3#HCompany

Hashtags

#ai #ml #mmlm #holo3 #hcompany

Machinelearning

@ai_machinelearning_big_data · Post #8373 · 27/08/2025 12:03

Trouver des similaires Voir

🌟MiniCPM-V 4.5: компактная модель, которая бьет гигантов в мультимодальном ИИ. Проект OpenBMB выпустил MiniCPM-V 4.5, мультимодальную модель на основе Qwen3-8B и SigLIP2-400M для распознавания изображений, серий изображений и видео, которая может работать на мобильных устройствах на более чем 30 языках. OpenBMB - некоммерческое подразделение китайской технологической компании ModelBest, под патронажем Университета Цинхуа. Среди инвесторов материнской ModelBest - Habo (Huawei), Primavera Capital Group и государственный Shenzhen Guozhong Venture Capital Management. 🟡Киллер-фича модели - эффективная работа с видео. Благодаря унифицированному 3D-Resampler модель сжимает видео в 96 раз: шесть кадров разрешением 448x448 преобразуются всего в 64 токена, тогда как большинству MLLM для этого потребовалось бы 1536 токенов. Это позволяет обрабатывать видео с частотой кадров до 10 FPS и длинные ролики без роста вычислительных затрат, что подтверждается топовыми результатами на наборах Video-MME, LVBench и MLVU. Архитектура LLaVA-UHD позволяет модели работать с изображениями до 1,8 мегапикселей и любым соотношением сторон, используя в 4 раза меньше визуальных токенов. Модель предлагает гибкий режим работы: быстрый ризонинг для повседневных задач и глубокий для сложных сценариев, переключаемый по требованию. При общем объеме в 8 млрд. параметров, MiniCPM-V 4.5 набирает 77.0 баллов по комплексному бенчу OpenCompass. Этот результат не просто улучшает предыдущие версии, модель превосходит GPT-4o-latest и Gemini-2.0 Pro, обходит открытую Qwen2.5-VL с 72 миллиардами параметров и устанавливает новый стандарт для общего MLLM на OmniDocBench. 🟡С инференсом тоже нет проблем. Доступны варианты для CPU через llama.cpp и ollama, есть квантованные версии в форматах int4, GGUF и AWQ, поддержка бэкендов SGLang и vLLM, возможность дообучения через Transformers и LLaMA-Factory, а также WebUI и оптимизированное iOS-приложение. ▶️ Чтобы было проще разобраться во всех вариантах запуска, разработчики заботливо подготовили подробный cookbook. 📌Лицензирование: MiniCPM Model License. 🟡Модель 🟡Demo 🟡Сообщество в Discord 🖥GitHub @ai_machinelearning_big_data #AI#ML#MMLM#MiniCPM#OpenBMB

Hashtags

#ai #ml #mmlm #minicpm #openbmb

BesnowCloud貝雪雲-公告頻道

@besnow_cloud · Post #3031 · 05/05/2025 06:34

Trouver des similaires Voir

🔊【#深度解读】你是否想过，AI 不再只是冰冷的工具，而正在进化成“数字物种”，以充满情感与个性的方式陪伴你工作与生活？🔍 微软 AI 掌门 Mustafa Suleyman 亲述：从 CoPilot 的情感工程，到未来工作形态、AI 伴侣化趋势……一探这场颠覆性浪潮背后的设计哲学。点击👇阅读完整深度解析 #AI#数字物种#情感AI#Copilot#未来工作 👉阅读全文

Hashtags

#深度解读 #ai #数字物种 #情感ai #copilot #未来工作

1 2•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••550•••600•••650•••700•••704 705706707 708•••750•••800•••838 839

← PrécédentPage 706 sur 839Suivant →