TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14993 · Jul 24

#jupyter_notebook Retrieval Augmented Generation (RAG) helps large language models (LLMs) answer questions using up-to-date or private information by connecting them to external data sources, unlike fine-tuning which retrains the model on specific data. RAG is useful when you need current, dynamic information without costly retraining, making it ideal for tasks like customer support or knowledge management. Fine-tuning is better for deep expertise in a specialized field but requires more data and effort. Using RAG lets you get accurate, relevant answers quickly by combining the model’s language skills with fresh, specific data, improving usefulness and reliability. https://github.com/langchain-ai/rag-from-scratch

Results

1 similar post found

Search: #smallmodel

当前筛选 #smallmodel清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8975 · 11/12/2025, 01:03 PM

⭐VibeThinker-1.5B - миниатюрная модель, которая показывает SOTA-результаты в задачах рассуждения. 🚀Производительность: одна из лучших на AIME24/25 и HMMT25 - превосходит DeepSeek R1-0120 по математическим задачам и опережает модели такого же размера в соревновательном программировании. ⚡Эффективность: всего 1.5B параметров. то есть в 100–600 раз меньше, чем гиганты вроде Kimi K2 и DeepSeek R1. 💰Стоимость: полный пост-тренинг обошёлся всего в $7.8K, примерно в 30–60 раз дешевле, чем у DeepSeek R1 или MiniMax-M1. Модель основана на Spectrum-to-Signal Principle (SSP) и MGPO-фреймворке, оптимизирующих процесс рассуждения. 📦Model:https://huggingface.co/WeiboAI/VibeThinker-1.5B 💻GitHub:https://github.com/WeiboAI/VibeThinker 📄Arxiv:https://arxiv.org/abs/2511.06221 @ai_machinelearning_big_data #AI#LLM#Reasoning#OpenSource#SmallModel