@AITimes365 · Post #253 · 14.10.2025 г., 07:23
#境内AI#蚂蚁集团#Ring1T#Ling1T 蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。 开源地址 / 在线体验 来自频道:智能视界
TGINSIGHT SIMILAR POSTS
Изворен канал @pythonotes · Post #156 · 2 окт.
Те, кто в Python не первый день, хорошо знают, что на число можно умножить не только число, но и другие типы. Главное, чтобы у этих типов была реализация такой операции. # list >>> [1] * 3 [1, 1, 1] # tuple >>> (2, 3) * 3 (2, 3, 2, 3, 2, 3) # string >>> "A" * 3 "AAA" Так работает полиморфизм стандартных типов. Интересно здесь то, что это сработает и в том случае, когда порядок операндов обратный. То есть int умножить на [тип]. # list >>> 3 * [1] [1, 1, 1] # tuple >>> 3 * (2, 3) (2, 3, 2, 3, 2, 3) # string >>> 3 * "A" "AAA" Если хотите реализовать такое поведение в ваших классах то следует помнить два момента: 1. Если множитель справа, то вам нужно реализовать метод __mul__, наш класс это первый операнд, то есть слева. myType * 3 2. Если множитель слева, то вам нужно реализовать метод __rmul__, наш класс это второй операнд, справа. 3* myType Всё тоже самое можно делать и для других математических операторов. И если в этом примере действие и результат будут фактически одинаковыми, то бывают ситуации, когда это не так. Например, при умножении матриц имеет значение порядок операндов. Для других операторов, таких как деление или сдвиг, очень важно кто с какой стороны находится. >>> 2/4, 4/2 (0.5, 2.0) >>> 2<<3, 3<<2 (16, 12) >>> 100%15, 15%100 (10, 15) #tricks#basic
Пребарај: #ling1t
@AITimes365 · Post #253 · 14.10.2025 г., 07:23
#境内AI#蚂蚁集团#Ring1T#Ling1T 蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。 开源地址 / 在线体验 来自频道:智能视界
@ai_machinelearning_big_data · Post #8721 · 08.10.2025 г., 18:50
✔️Ling-1T - новая модель от inclusionAI с 1 триллионом параметров Модель на 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура). Она обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений. Контекст: 128 000 токенов. Построена на базе Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - нового метода обучения для масштабируемых рассуждений. При помощи Evo-CoT модель постепенно улучшает баланс между точностью рассуждений и вычислительной эффективностью. То есть с каждым шагом она пытается делать рассуждения «глубже», но не слишком дорого по ресурсам. Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации. В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов. Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными. https://huggingface.co/inclusionAI/Ling-1T @ai_machinelearning_big_data #Ling1T#AI#ML#OpenSource#Reasoning#TrillionScale#FP8