TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14686 · May 8

#python#asr#deeplearning#generative_ai#large_language_models#machine_translation#multimodal#neural_networks#speaker_diariazation#speaker_recognition#speech_synthesis#speech_translation#tts NVIDIA NeMo is a powerful, easy-to-use platform for building, customizing, and deploying generative AI models like large language models (LLMs), vision language models, and speech AI. It lets you quickly train and fine-tune models using pre-built code and checkpoints, supports the latest model architectures, and works on cloud, data center, or edge environments. NeMo 2.0 is even more flexible and scalable, with Python-based configuration and modular design, making it simple to experiment and scale up. The main benefit is that you can create advanced AI applications faster, with less effort, and at lower cost, while getting high performance and easy deployment options[1][2][3]. https://github.com/NVIDIA/NeMo

Results

1 similar post found

Search: #fp8

当前筛选 #fp8清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8721 · 10/08/2025, 06:50 PM

✔️Ling-1T - новая модель от inclusionAI с 1 триллионом параметров Модель на 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура). Она обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений. Контекст: 128 000 токенов. Построена на базе Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - нового метода обучения для масштабируемых рассуждений. При помощи Evo-CoT модель постепенно улучшает баланс между точностью рассуждений и вычислительной эффективностью. То есть с каждым шагом она пытается делать рассуждения «глубже», но не слишком дорого по ресурсам. Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации. В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов. Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными. https://huggingface.co/inclusionAI/Ling-1T @ai_machinelearning_big_data #Ling1T#AI#ML#OpenSource#Reasoning#TrillionScale#FP8