TGTGInsighttelegram intelligenceLIVE / telegram public index
← QIN2DIM's Tech Channel
QIN2DIM's Tech Channel avatar

TGINSIGHT POST

Post #1471

@qin2dim

QIN2DIM's Tech Channel

Views65Post view count
PostedAug 1408/14/2025, 04:24 AM
Post content

Post content

DeepSeek 因华为芯片问题推迟新 AI 模型发布 据三位知情人士透露,中国人工智能公司 DeepSeek 因未能在华为昇腾芯片上成功训练其 R2 模型,而推迟了该模型的发布。此前在今年 1 月推出 R1 模型后,有关部门鼓励公司改用华为系统替代英伟达系统。训练问题导致原定 5 月的发布推迟,并使 DeepSeek 在竞争中落后。消息人士称,华为曾派工程师协助,但未能完成一次成功的训练运行。DeepSeek 仍在与华为合作,使该模型在推理阶段与华为芯片兼容。 “模型是可以轻易替换的商品,”加州大学伯克利分校人工智能研究员 Ritwik Gupta 表示,并指出阿里巴巴的通义千问 Qwen3 等竞争对手更高效地采用了 DeepSeek 的核心推理算法。Gupta 补充称,华为在昇腾芯片的训练上正经历“成长的阵痛”,但预计会逐步适应。DeepSeek 和华为对此均未置评。 来源:金融时报