新浪新闻客户端

DeepSeek V4灰度测试全解析:万亿参数模型如何重塑AI算力版图?

DeepSeek V4灰度测试全解析:万亿参数模型如何重塑AI算力版图?
2026年04月11日 06:44 新浪网 作者
avatar
每日新闻摘录

  2026年4月8日凌晨,DeepSeek悄然进行了一次重量级界面更新。大量用户打开DeepSeek网页端或App时,发现输入框上方原本熟悉的“深度思考(R1)”与“智能搜索(联网)”双选项已被替换为两个全新图标:一道闪电代表的“快速模式”和一枚钻石代表的“专家模式”。这次更新并非全量推送,而是典型的灰度测试——仅部分用户能够看到新界面,其余用户则可通过在对话框中输入“专家模式”来手动触发新版功能。

  值得注意的是,在部分灰度测试用户的界面上,还短暂出现过第三个“视觉模式”选项。但根据最新实测反馈,当前版本的快速模式尚不支持真正的“视觉识别”——能够提取图片文字(OCR),但无法识别照片中的人物或物体。因此在本文的讨论框架内,我们聚焦于已公开落地的快速模式与专家模式,以及它们背后承载的V4架构创新。

  第一,这是百万级上下文容量的实战压力测试。 此次灰度版本将上下文窗口从V3系列的128K Token直接扩容至1M(100万)Token,相当于一次可处理《三体》三部曲体量的超长文本。在用户并发请求的环境下,KV缓存的数据量激增数倍,只有真实流量的冲击才能验证长上下文场景下的集群稳定性与成本边界。

  第二,这是V4架构创新的工程验证窗口。 DeepSeek V4并非V3的简单参数堆砌,而是引入了Engram条件记忆、mHC流形约束超连接以及DeepSeek稀疏注意力等多项底层架构创新。这些新架构在实验室中的收敛性和推理效率表现如何,需要通过真实多样化的用户输入来验证。尤其是Engram模块中高达1000亿参数的嵌入表被卸载到CPU内存后,在混合负载下的推理吞吐量降幅是否真的控制在3%以内——这些只能在灰度环境中得到答案。

  第三,这是国产算力生态适配的最终磨合阶段。 据多家权威媒体报道,DeepSeek V4已全面基于华为昇腾芯片完成适配和优化,对模型底层代码进行了大量调整与重写。通过灰度测试阶段收集的硬件运行数据,DeepSeek能够与芯片厂商进行联合调优,为国产算力生态的规模化落地铺平道路。

  DeepSeek对这一难题的解决方案是DeepSeek稀疏注意力(DeepSeek Sparse Attention,DSA) 。DSA通过智能稀疏模式将计算资源集中在上下文的最相关部分,而非平等对待所有Token。据技术资料显示,DSA在支持超过100万Token上下文窗口的同时,相比标准注意力机制计算成本降低约50%。

  灰度版本的第二个显著变化是知识库截止日期的更新。在关闭联网搜索功能后,模型仍能准确输出2025年4月的新闻内容,表明训练数据已覆盖至2025年5月。这一改进看似简单,实则需要完整的训练流水线支撑。

  根据DeepSeek在2025年底至2026年初发表的一系列研究论文,V4的训练数据策略已经形成了“知识密集型数据”与“推理密集型数据”的分治范式。Engram条件记忆模块承担了静态知识的高效存储与检索,而MoE专家网络则专注于动态推理。这种分工使得新增知识数据的注入不会干扰已有的推理能力,大幅降低了模型持续更新的边际成本。

  第一阶段:检索(Retrieval) 。对于输入序列中的每一个位置 t t t,Engram提取当前位置的后缀N-Gram(通常取 N = 3 N=3 N=3 N = 4 N=4 N=4),并通过多头哈希机制以确定性的方式检索对应的静态嵌入向量。设输入序列为 X = ( x 1 , x 2 , … , x T ) X=(x_1, x_2, \ldots, x_T) X=(x1,x2,,xT),对于位置 t t t 的N-Gram上下文 c t = ( x t − N + 1 , … , x t ) c_t = (x_, \ldots, x_t) ct=(xtN+1,,xt),哈希检索过程可表示为:

  Engram模块被集成到Transformer的多个中间层,每层都拥有独立的记忆表。由于哈希检索是确定性的,Engram支持在运行时从主机内存预取相关记忆嵌入,几乎不带来额外推理开销。论文数据显示,将1000亿参数的Engram表完全卸载到DRAM中,端到端吞吐量下降不到3%。

  DeepSeek延续了其一贯的开源策略。Engram模块的完整实现已上传至GitHub,项目地址为 https://github.com/deepseek-ai/Engram。mHC和DSA的相关论文也已公开发表。这种“发布即交付、研究即产品”的模式,体现了DeepSeek对技术即时影响力与生态构建的重视。

  尽管当前灰度版本仍以纯文本能力为主(快速模式的图片处理仅限OCR文字识别),但V4系列的长期演进方向已然清晰。据多家媒体报道,V4完整版将采用原生多模态架构,从预训练阶段就将文本与视觉理解融合,而非后期拼接。市场也期待DeepSeek推出面向AI编程场景的专属版本,在R1已取得的代码生成突破基础上再次实现技术跃升。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
推理AI
权利保护声明页/Notice to Right Holders

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2026 SINA Corporation

All Rights Reserved 新浪公司 版权所有