NVIDIA 解释 Together Compute 选择 Blackwell 服务 DeepSeek-V4 原因

robot
摘要生成中

AIMPACT 消息,5 月 14 日(UTC+8),NVIDIA 官方账号 NVIDIAAI 近日发文,解释了 Together Compute 选择 Blackwell 架构服务 DeepSeek-V4 的原因。文中指出,Blackwell 针对长上下文推理中的关键瓶颈进行了优化,包括解码阶段的 KV-cache 压力以及预填充阶段的 MoE 权重带宽。此外,文中还提到了单个 NVIDIA HGX B200 系统的能力,但未提供具体性能数据或对比指标。(来源:InFoQ)

NVDA1.04%
DEEPSEEK-1.26%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论