发布日期:2026-04-24 14:48 点击次数:133

IT之家 4 月 24 日讯息,今天上昼,DeepSeek-V4 模子预览版认真上线并同步开源。

华为官方随后晓喻,通过两边芯模时刻精采协同,完好意思昇腾超节点全系列产物维持 DeepSeek V4 系列模子。
官方示意,昇腾 950 通过和会 kernel 和多流并行时刻缩小 Attention 盘算和访存支出,大幅擢升推感性能,辘集多种量化算法,完好意思了高混沌、低时延的 DeepSeek V4 模子推理部署。昇腾 A3 超节点系列产物也全面适配,同期为便于用户快速微调,提供了基于昇腾 A3 超节点的本质参考完好意思。
IT之家获悉,基于 DeepSeek V4-Pro 模子,okooo澳客在 8K 输入场景,昇腾 950 超节点可完好意思 TPOT 约 20ms 时单卡 Decode 混沌 4700TPS。DeepSeek V4-Flash 模子,8K 长序列输入场景下可完好意思 TPOT 约 10ms 时单卡 Decode 混沌 1600TPS(上述 Benchmark 数据均基于 Offine 推理方式收集,不包含 Serving 调治和框架负载平衡影响)。
基于昇腾 A3 64 卡超节点辘集大 EP 方式部署,DeepSeek V4-Flash 模子,8K/1K 输入输出场景,基于 vLLM 推理引擎可完好意思 2000+TPS 的单卡 Decode 混沌,单卡混沌执续擢升。官方示意,针对 DeepSeek V4-Pro 模子,昇腾 A3 同步维持推理部署,性能执续优化中。
米乐体育app官方网站
Copyright © 1998-2026 okooo澳客APP官方网站™版权所有
技术支持:®澳客app RSS地图 HTML地图