TGTGInsighttelegram intelligenceLIVE / telegram public index
← AppPie
AppPie avatar

TGINSIGHT POST

Post #2288

@AppPie

AppPie

Views1,240帖子阅读量
发布12月27日2024/12/27 02:02
Post content

帖子内容

#AI DeepSeek-V3 发布:性能对标 GPT-4o, 全面开源 🔗GitHub DeepSeek 今天发布了全新系列模型 V3 的首个版本,可通过 chat.deepseek.com 体验,API 服务已同步更新。 模型亮点 • 架构:自研 MoE 架构,总参数量 671B,激活参数 37B • 训练:在 14.8T token 上预训练 • 性能:多项评测超越 Qwen2.5-72B、Llama-3.1-405B,对标 GPT-4o 和 Claude-3.5-Sonnet • 速度:生成速度提升至 60 TPS,比 V2.5 提升 3 倍 优势领域 • 百科知识:接近 Claude-3.5-Sonnet 水平 • 长文本理解:在多个基准测试中领先 • 代码能力:算法类场景远超非 o1 模型 • 数学能力:在多个竞赛测试中领先开源闭源模型 • 中文处理:在知识类任务上表现优异 API 定价 • 新价格:输入 0.5元/2元,输出 8元(每百万tokens) • 优惠期:至2025年2月8日,输入 0.1元/1元,输出 2元 开源支持 • 原生 FP8 权重开源 • SGLang 和 LMDeploy 支持 FP8 推理 • TensorRT-LLM 和 MindIE 支持 BF16 推理 • 提供 FP8 到 BF16 转换脚本 #DeepSeek#AI#LLM#OpenSource 📮 频道 @AppPie​​​​​​​​​​​​​​​​