TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
帖子内容
GLM-5 完全用华为昇腾芯片训练 #人工智能 北京智谱华章科技有限公司发布了其最新的大模型 GLM-5,采用混合专家架构,有 7450 亿个参数,256 个专家,每次推理激活 440 亿个参数。今天几乎所有大模型都使用英伟达的 AI 芯片训练,GLM-5 的不同寻之处是它声称完全使用华为昇腾芯片,采用 MindSpore 框架训练,摆脱了对美国硬件的依赖。 https://glm5.net/ https://z.ai/blog/glm-5