TGTGInsightinteligencia telegramLIVE / telegram public index
← Comunidad de TWITTER en Cuba

TGINSIGHT SIMILAR POSTS

Buscar contenido similar

Canal fuente @ClientesEtecsa · Post #11708 · 11 oct

🗞🇨🇺☀️ ¡Buenos días! Les compartimos las primeras notas de este viernes, que se pueden leer con VPN desde Cuba: ✈️ El Congreso hondureño tumba el acuerdo aéreo firmado por Xiomara Castro y el régimen cubano https://bit.ly/3YmNbV3 ☝🏼 Obama compara los discursos de Trump con los de Fidel Castro y lo acusa de "dividir" EE UU https://bit.ly/3BFEMTH 🌀 El huracán Milton deja una senda de muerte y destrucción a su paso por Florida https://bit.ly/3YnOza0 ⚖️ Evo Morales es citado para declarar en un caso de presunta "trata de personas" y "estupro" https://bit.ly/3BwAlKW 🏆 Nobel de la Paz a una organización japonesa contra el uso de las armas nucleares https://bit.ly/3Y0dZJm 🔊#Podcast Reinaldo Escobar: ‘Como lo viví’ del 11 de octubre de 2024 https://bit.ly/4dQULMc 📰 Como todos los viernes, les compartimos nuestra versión en PDF para que lean lo mejor de la semana en 14ymedio https://bit.ly/48b6tA0 🎙 El Cafecito Informativo con Yoani Sánchez https://bit.ly/3Nlxnvd 👋 ¡Hasta más tarde!

Hashtags

Resultados

1 posts similares encontrados

Buscar: #fp8

当前筛选 #fp8清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8721 · 08/10/2025, 18:50

✔️Ling-1T - новая модель от inclusionAI с 1 триллионом параметров Модель на 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура). Она обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений. Контекст: 128 000 токенов. Построена на базе Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - нового метода обучения для масштабируемых рассуждений. При помощи Evo-CoT модель постепенно улучшает баланс между точностью рассуждений и вычислительной эффективностью. То есть с каждым шагом она пытается делать рассуждения «глубже», но не слишком дорого по ресурсам. Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации. В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов. Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными. https://huggingface.co/inclusionAI/Ling-1T @ai_machinelearning_big_data #Ling1T#AI#ML#OpenSource#Reasoning#TrillionScale#FP8