TGINSIGHT CHAT
Machinelearning
@ai_machinelearning_big_data
ТехнологииПогружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Последние посты
Тег: #alibaba · 4 постов
🌟Zvec: встраиваемая векторная база данных для RAG без внешних сервисов. Alibaba открыла исходный код Zvec - встраиваемой векторной СУБД, которую авторы называют «SQLite для векторных баз данных». Проект заточен на локальные RAG-пайплайны, семантический поиск и агентские сценарии на ноутбуках, мобильных устройствах или другом edge-железе. Идея в том, что разворачивать отдельный сервер ради векторного поиска и фильтрации по метаданным избыточно. Zvec встраивается в процесс Python-приложения и не требует ни отдельного демона, ни сетевых вызовов. Существующие решения не подходят для маломощных устройств: Faiss дает только ANN-индекс без скалярного хранилища и крэш-рекавери; DuckDB-VSS ограничен в опциях индексирования; Milvus и облачные векторные хранилища требуют сеть. Под капотом - Proxima, векторный движок продакшен-уровня, который Alibaba сама использует в собственных сервисах. Поверх него сделали лаконичный Python API: 🟢полный CRUD и поддержка схем; 🟢поиск по нескольким векторам для комбинации разных эмбеддинг-моделей; 🟢встроенный реранкер с weighted и RRF; 🟢гибридный поиск (векторный + фильтры по скалярным полям) с инвертированными индексами. Это позволяет собирать локальных ассистентов, которые одновременно используют семантический поиск, множественную фильтрацию и несколько эмбеддинг-моделей - все в одном движке. По производительности Zvec заявляет победу на бенче VectorDBBench с датасетом Cohere 10M - более 8 000 QPS при сопоставимом реколле. Это вдвое больше, чем у лидера ZillizCloud и с более быстрым построением индекса. Авторы объясняют успех глубокой оптимизацией под CPU: SIMD, кэш-эффективные структуры, многопоточность и prefetching. Пока платформенная поддержка ограничена (Windows отсутствует), но для Linux x86/ARM64 и macOS Zvec уже готов к экспериментам на Python 3.10–3.12. 📌Лицензирование: Apache 2.0 License. 🟡Статья 🟡Документация 🖥GitHub @ai_machinelearning_big_data #AI#ML#VDB#ZVEC#Alibaba
🧠 Qwen3-MT — Alibaba продолжает жечь и выпускает еще одну модель, в этот раз для машинного перевода. 🌍 Поддерживает 92+ языка, на которых говорит 95% населения мира 📚 Обучен на триллионах токенов из интернета, открытых документов и книгах, субтитров из видео. 🔬 Что внутри: - Модель Qwen3-MoE-72B с архитектурой Mixture-of-Experts - Заточена на переводческие фишки, поддерживает сложную терминологию и даже очень редкие слова. - RLHF: обучение с подкреплением повышает точность и естественность модели Возможности: ✅ Обеспечивает качественный перевод в реальном времени ✅ Контроль стиля и терминов ✅ Масштабируемость для API и продакшена ✅ Цена — от $0.5 за миллион токенов 🟡 Попробовать демку: https://huggingface.co/spaces/Qwen/Qwen3-MT-Demo 🟡 ModelScope: https://modelscope.cn/studios/Qwen/Qwen3-MT-demo 🟡 Документация API:https://alibabacloud.com/help/en/model-studio/translation-abilities 🟡 Блог с подробностями: https://qwenlm.github.io/blog/qwen-mt/ @ai_machinelearning_big_data #Qwen#Alibaba#ml#llm#ai
🚀 Qwen3-Coder — новая мощная open-source модель от Alibaba для кодинга Модель с архитектурой MoE: - 480B параметров в общей сложности - 35B активных параметров - Контекст 256k, но легко масштабируется до 1M токенов 📈 Производительность: - На уровне Claude 4 Sonnet - Лучше или на уровне GPT-4.1 на многих задачах - Обходит Kimi K2, DeepSeek V3 на ряде бенчмарков 🧩 Модель уже доступна: - На HuggingFace — можно скачать и запускать - В OpenRouter — $1/M токенов вход, $5/M выход (в 3 раза дешевле Claude Sonnet: $3 и $15) 💬 Попробовать бесплатно можно: - Через чат: ttps://chat.qwen.ai/) - GitHub link: https://github.com/QwenLM/qwen-code Qwen3-Coder — это просто одна из лучших моделей для программирования, которые мы когда-либо видели. #qwen#ml#ai#llm#Alibaba @data_analysis_ml
🌟HumanOmniV2: модель, которая понимает контекст видео. Alibaba Group разработали HumanOmniV2, модель на базе Qwen2.5-Omni-7B-thinker, которая получила навык осмысления визуального контекста за счет изменения самого процесса мышления модели. Ее научили следовать строгому формату: сначала описать контекст, потом рассуждать и только затем давать ответ. Теперь, прежде чем отвечать на вопрос, модель генерирует подробное описание сцены в теге <context>. На этом этапе она фиксирует, кто что делает, какой фон, какие звуки слышны. Только после этого в теге <think> она строит логическую цепочку рассуждений, связывая вопрос с собранным контекстом. И лишь в конце выдает результат в теге <answer> . Чтобы этот подход работал, его усилили системой вознаграждений на основе RL. За точность и правильный формат модель получает стандартные награды, но были введены и две новых: 🟢«Награда за контекст» дается, если его описание полное и релевантное, причем качество этого описания оценивает другая, более мощная LLM; 🟢«Логическая награда» проверяет, что в своих рассуждениях модель действительно использовала данные из видео и аудио, а не проигнорировала их. Для оценки HumanOmniV2 создали бенчмарк IntentBench (633 видео, 2689 вопросов) на основе Social-IQ 2.0, EMER и MDPE. Его фишка в том, что вопросы требуют одновременного анализа: видеоряда (жесты, микровыражения), диалогов (тон, смысл реплик) и социального контекста (ирония, обман, скрытые намерения). Тестовая модель обошла открытые аналоги на 3 бенчмарках: 🟠Daily-Omni: 58.47% (53.13% у MiniCPM-o 2.6); 🟠WorldSense: 47.1% (45.4% у Qwen2.5-Omni); 🟠IntentBench: 69.33% (64.20% у Qwen2.5-Omni). 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI#ML#MMLM#HumanOmniV2#Alibaba
Hashtags