TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15539 · Mar 5

#python#agent#llm#llm_agent#llm_reasoning#machine_learning_systems#mlsys#reinforcement_learning#rl AReaL is a free, open-source system for fast asynchronous reinforcement learning to train large AI models in math, coding, search, and agents. It decouples generation and training for up to 2.77x speedup, stable performance, and easy setup on single or 1000+ GPUs with algorithms like GRPO/PPO. Install via git/pip, run examples like GSM8K math instantly. You benefit by building top AI agents affordably and quickly, reproducing results with shared data/models, saving time/money vs. slow synchronous tools. https://github.com/inclusionAI/AReaL

Results

1 similar post found

Search: #lplb

当前筛选 #lplb清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9025 · 11/20/2025, 12:15 PM

💡DeepSeek выложили новый open-source проект — LPLB. Это экспериментальный балансировщик нагрузки для моделей Mixture-of-Experts (MoE). В репозитории описано, как система: • динамически перераспределяет экспертов, опираясь на статистику нагрузки; • создаёт реплики с учётом топологии кластера; • решает оптимальное распределение токенов по экспертам через LP-решатель, работающий прямо на GPU (cuSolverDx + cuBLASDx); • использует метрики загрузки, полученные вручную, через torch.distributed или через буферы Deep-EP. Гайд показывает, как может выглядеть умный и точный балансировщик для больших MoE-архитектур. GitHub: https://github.com/deepseek-ai/LPLB ai_machinelearning_big_data #DeepSeek#LPLB#MoE#AIInfrastructure#OpenSource