腾讯云DeepSeek-V4最高降价97.5%:AI大模型价格战进入深水区
6月3日零点起,腾讯云智能体开发平台的DeepSeek-V4系列模型价格正式下调,旗舰版DeepSeek-V4-Pro推理成本直降75%,缓存命中价格降幅更达97.5%。经济型DeepSeek-V4-Flash的缓存命中价格也下调90%。这次调价后,腾讯云的DeepSeek-V4调用价格与DeepSeek官方定价完全一致,用户无需再为通过云平台调用支付溢价。
降价细节:两大主力模型的具体调整
本次调价覆盖DeepSeek-V4系列两款主力模型。旗舰版DeepSeek-V4-Pro的推理输入和输出价格均下降75%,分别降至0.003元/千令牌和0.006元/千令牌;缓存命中价格降幅最为惊人,达到97.5%,仅为0.000025元/千令牌。经济型DeepSeek-V4-Flash的缓存命中价格下降90%,整体使用成本大幅拉低。值得注意的是,腾讯云强调此次调价仅涉及价格,模型服务能力保持不变。
这组数字的意义在于:一个使用DeepSeek-V4-Pro处理100万令牌输入的任务,在调价前后的费用差距可能达到数倍。对于日均调用量达千万令牌级别的企业应用,成本节省更为可观。缓存命中价格降至几乎可以忽略的水平,意味着高频重复查询场景下的边际成本趋近于零。
价格战背后的行业逻辑
这次调价并非孤立事件。2026年5月22日,DeepSeek官方已将V4-Pro模型的API价格从限时优惠转为永久降价策略,正式定格为原价的四分之一。腾讯云此番跟进,本质上是将平台接入层面的价格与官方拉平,消除中间商溢价。
更大的背景是:2026年一季度,字节跳动豆包、阿里通义、百度文心、智谱GLM等国产大模型集体降价,最高降幅达97%。据南方周末报道,中国AI模型竞争已进入两极分化——一边是DeepSeek式的价格跳水,另一边是部分云服务商因算力成本上升而上调部分模型价格。腾讯云此次降价的DeepSeek-V4系列模型,恰恰是市场上最具性价比的选择之一,调价后将进一步挤压其他平台的利润空间。
DeepSeek-V4的技术底座为何撑得起低价
DeepSeek-V4系列于2026年4月24日正式发布,采用MoE(混合专家)稀疏架构,总参数1.6万亿、激活参数仅49B,原生支持100万令牌上下文。其核心技术包括MiniMax Sparse Attention(MSA)稀疏注意力、Engram记忆机制和mHC稳定训练策略,在保证模型能力的前提下大幅降低了推理计算量。
更关键的是,DeepSeek-V4-Pro已在华为昇腾910C国产算力集群上完成全参数后训练,MFU(模型计算利用率)稳定在34.9%,证明了国产算力的可行性。这意味着DeepSeek的推理成本不完全依赖进口GPU,为持续低价提供了硬件层面的底气。开源策略也是重要一环——DeepSeek-V4是全球唯一同时具备前沿Coding能力、1M超长上下文和原生多模态三大能力的开源模型,社区生态的繁荣反过来摊薄了研发成本。
对企业用户的实际影响
对企业而言,这轮降价的影响远不止省钱二字。首先,API成本的断崖式下降让原本因预算限制无法使用顶级大模型的中小企业,有了接入GPT-5.5同级别能力模型的可能。DeepSeek-V4-Pro在SWE-Bench Pro上的得分达到59.0%,已超越GPT-5.5和Gemini 3.1 Pro。
其次,缓存命中价格的极端压低,直接利好RAG(检索增强生成)、智能客服、知识库问答等高频重复查询场景。这类应用往往80%以上的请求命中缓存,调价后的实际调用成本可能只有原来的几十分之一。
不过,价格战也带来隐忧。云服务商在模型API上的利润空间持续压缩,长期可持续性存疑。同时,过低的价格可能引发劣币驱逐良币的风险——部分服务商为压缩成本而牺牲推理质量或服务稳定性,企业选型时仍需综合评估。
AI大模型的价格正在从奢侈品走向水电煤,腾讯云和DeepSeek此番调价只是这个进程的最新注脚。当调用成本不再是瓶颈,真正的竞争将转向谁能把模型用得更好——应用层的创新,才是下一阶段的主战场。