TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14835 · Jun 17

#jupyter_notebook#jax Flax is a library for creating neural networks with JAX. It offers a flexible way to build and analyze these networks. The new Flax NNX API makes it easier to work with neural networks by using regular Python objects, which helps in creating, debugging, and analyzing models more efficiently. This means users can express their models in a more intuitive way, making it simpler to develop and modify neural networks. Flax also provides many tools and examples to help users get started quickly. https://github.com/google/flax

Results

1 similar post found

Search: #fp8

当前筛选 #fp8清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8721 · 10/08/2025, 06:50 PM

✔️Ling-1T - новая модель от inclusionAI с 1 триллионом параметров Модель на 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура). Она обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений. Контекст: 128 000 токенов. Построена на базе Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - нового метода обучения для масштабируемых рассуждений. При помощи Evo-CoT модель постепенно улучшает баланс между точностью рассуждений и вычислительной эффективностью. То есть с каждым шагом она пытается делать рассуждения «глубже», но не слишком дорого по ресурсам. Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации. В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов. Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными. https://huggingface.co/inclusionAI/Ling-1T @ai_machinelearning_big_data #Ling1T#AI#ML#OpenSource#Reasoning#TrillionScale#FP8