TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15432 · Jan 23

#jupyter_notebook#chinese_llm#chinese_nlp#finetune#generative_ai#instruct_gpt#instruction_set#llama#llm#lora#open_models#open_source#open_source_models#qlora AirLLM is a tool that lets you run very large AI models on computers with limited memory by using a smart layer-by-layer loading technique instead of traditional compression methods. You can run a 70-billion-parameter model on just 4GB of GPU memory, or even a 405-billion-parameter model on 8GB, without losing model quality. The benefit is that you can use powerful AI models on affordable hardware without expensive upgrades, and the tool also offers optional compression features that can speed up performance by up to 3 times while maintaining accuracy. https://github.com/lyogavin/airllm

Results

1 similar post found

Search: #unifiedembedding

当前筛选 #unifiedembedding清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8801 · 10/17/2025, 10:13 AM

⚡️ Omni-Embed-Nemotron - новая единая модель от NVIDIA для поиска по тексту, изображениям, аудио и видео Модель обучена на разнообразных мультимодальных данных и может объединять разные типы входных сигналов в общее векторное представление. - Поддержка всех типов данных: текст, изображение, аудио, видео. - Основана на архитектуре Qwen Omni (Thinker-модуль, без генерации текста). - Контекст - до 32 768 токенов, размер embedding — 2048. - Оптимизирована под GPU, поддерживает FlashAttention 2. Это делает её идеальной для: - кросс-модального поиска (поиск текста по видео или изображению); - улучшения RAG-проектов; - систем мультимодального понимания контента. Просто, быстро и эффективно - всё в одном открытом решении. 🌐 Открытая модель: https://huggingface.co/nvidia/omni-embed-nemotron-3b @ai_machinelearning_big_data #crossmodal#retrieval#openAI#NVIDIA#OmniEmbed#multimodal#AIModels#OpenSource#Search#UnifiedEmbedding