TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15513 · Feb 20

#python#agents#claude#cursor#databricks#vibecoding The Databricks AI Dev Kit enhances AI-driven development by providing your coding assistant (Claude Code, Cursor, etc.) with trusted Databricks knowledge and best practices. It includes a Python library, MCP server with 50+ tools, markdown skills teaching Databricks patterns, and a web-based builder app. You can build Spark pipelines, jobs, dashboards, knowledge assistants, and deploy ML models faster and smarter. The benefit is that your AI coding assistant gains direct access to Databricks functionality and patterns, enabling you to develop data and AI applications more efficiently with built-in governance and best practices. https://github.com/databricks-solutions/ai-dev-kit

Results

1 similar post found

Search: #mistralsmall4

当前筛选 #mistralsmall4清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9685 · 03/18/2026, 02:15 PM

⚡️Mistral выпустила Small 4. Mistral Small 4 - это мультимодальный комбайн, который закрывает сразу три задачи: ризонинг, агентный кодинг и работу с изображениями. Раньше под каждую из них была отдельная модель: Magistral, Devstral и Pixtral. Теперь один чекпоинт, 🟡Архитектура MoE с 128 экспертами, из которых на каждый токен активируются 4. Всего 119B параметров, активных - 6B на токен. Контекстное окно - 256 тыс. токенов. По сравнению с Mistral Small 3 в новой версии задержка сократилась на 40%, пропускная способность выросла в 3 раза. Ключевая фича - параметр reasoning_effort. Если поставить none будет быстрый чат-режим, как в Small 3.2, а с ключом high модель начнет разворачивать цепочку рассуждений, сопоставимую с Magistral. Переключение в рантайме, без смены модели. 🟡Тесты Small 4 с включенным reasoning обходит GPT-OSS 120B на LiveCodeBench и генерирует при этом на 20% меньше токенов. На AA LCR набирает 0.72 при длине ответа 1.6K символов. Для сравнения, модели Qwen для тех же результатов нужно от 5.8K до 6.1K. Для self-hosted деплоя минимальный стенд - 4× NVIDIA HGX H100, 2× HGX H200 или 1× DGX B200. Попробовать бесплатно можно на build.nvidia.com, через Mistral API или AI Studio. 📌 Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей @ai_machinelearning_big_data #AI#ML#LLM#MistralSmall4#MistralAI