DeepSeek击穿大模型底价,百万Tokens低至2分钱
重塑定价格局,DeepSeek再度登场。
4月26日,DeepSeek发布API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一,其中,Pro模型在2026年5月5日前还可叠加2.5折限时优惠。
DeepSeek官方API定价页显示,本次降价覆盖V4系列全模型,核心调整集中在输入缓存命中场景。调价后,DeepSeek-V4-Flash每百万Tokens(词元)输入缓存命中价格为0.02元,DeepSeek-V4-Pro为0.025元。
面向企业级用户的DeepSeek-V4-Pro降价幅度更大,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前叠加2.5折限时特惠,实际仅0.025元/百万Tokens,缓存未命中输入从12元降至3元,缓存未命中输出从24元降至6元。
此轮降价意味着,处理相同百万Token的长文本或复杂智能体任务时,DeepSeek相关模型的成本被拉至极低的程度,对开发者而言,将可以以极低成本对DeepSeek V4进行评估测试。
有开发者认为,DeepSeek V4在工程层面进行了多项技术创新,效率较前代成倍提升——在百万级调用场景下,单Token推理算力消耗已降至V3.2的27%,KV cache(键值缓存,大模型推理过程中占用显存的主要部分之一)的显存占用仅为原来的10%。在此基础上,DeepSeek降价合情合理。

价格攻势冲刺专业客户
作为开源模型,DeepSeek历来以“低价+开源”策略吸引开发者生态,并在性能上接近于领先的闭源模型,成为专业客户的性价比选择。
DeepSeek-V4按大小分为Pro和Flash两个版本,其中V4-Pro总参数为1.6万亿,激活参数490亿,是迄今为止参数量最大的开源权重模型,定位高性能任务;V4-Flash总参数2840亿,激活参数130亿,主打低成本和高吞吐,能够提供更加快捷、经济的API服务。两款模型均采用MoE架构,也就是“混合专家模型”。
DeepSeek坦言,在Agentic Coding(智能体编程)评测中,DeepSeek-V4代码交付质量接近Claude Opus 4.6非思考模式,但仍与Opus 4.6思考模式存在一定差距;此外,DeepSeek-V4在世界知识测评中仅次于Gemini-Pro-3.1,但超过同期其他开源模型,在数学、STEM、竞赛型代码的测评中则比肩世界顶级闭源模型。
从价格上来看,V4-Flash走的是普惠路线,输入缓存命中0.02元/百万Tokens、未命中1元/百万Tokens、输出2元/百万Tokens的报价,对应中小开发者与轻量应用调用场景。V4-Pro更具性价比,其原价输出24元/百万Tokens的水平本就高于V4-Flash,但限时折扣后输出仅6元/百万Tokens,与上一代V3.2系列价格相当,却对应着1.6万亿参数的旗舰模型能力,极具性价比。
另一方面,DeepSeek也在积极适配国产算力,DeepSeek在定价说明中提到,受限于高端算力,目前Pro版服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。这意味着,DeepSeek定价将有进一步下探空间。
实际上,DeepSeek正在积极适配国产算力,将V4的早期访问权限优先开放给国内芯片厂商,而非英伟达、AMD等海外厂商,这被业内视为DeepSeek模型适配策略的关键转向。
根据华为公开信息,昇腾超节点全系列产品已全面适配DeepSeek V4,可实现V4-Pro约20毫秒、V4-Flash约10毫秒的低时延推理。基于昇腾950超节点,V4-Pro在8K输入场景下单卡Decode吞吐约4700 TPS;V4-Flash在同等输入场景下单卡Decode吞吐约1600 TPS。基于昇腾A3 64卡超节点的大EP(专家并行)部署模式下,V4-Flash在8K输入、1K输出场景下基于vLLM推理引擎可实现2000 TPS以上的单卡Decode吞吐。
摩尔线程(689.500, 51.00, 7.99%)披露,其携手上海AI实验室DeepLink团队,率先在AI训推一体智算卡MTT S5000上完成了核心算子Day-0适配。目前算子通过率已超80%,实现了模型发布与国产算力适配的同步落地。
竞争日趋激烈
此次降价正值全球大模型厂商竞相以更低价格、更高效率争夺开发者和企业客户之际。随着企业级用户从早期试点转向规模化部署,推理和调用成本已取代单纯模型能力,成为大模型厂商间竞争的重要因素。业内预计,DeepSeek此轮调价将进一步压低同行报价。
花旗在其最新研报指出,DeepSeek V4-Pro在核心AI性能指标上已与顶尖闭源模型Claude Sonnet 4.6表现持平,同时定价却远低于GPT-5.5。花旗认为,这一现象凸显当前AI大模型赛道中开源模型与闭源领先模型日益加剧的两极分化趋势。得益于极具成本竞争力的底层架构,开源模型在代码生成、智能体工作流及长文本等应用场景中,与闭源巨头的差距正在缩小。
在国产模型阵营内部,DeepSeek V4-Pro的限时折扣价亦明显低于多数同档位产品。按输出端价格计算,DeepSeek V4-Pro折扣价为0.87美元/百万Tokens;智谱GLM-5.1、月之暗面Kimi K2.6的输出端报价分别为4.4美元/百万Tokens和4.0美元/百万Tokens,约为其5倍和4.6倍。
根据在全球最大的API聚合平台OpenRouter当前报价,阿里Qwen3.6 Plus输出端约为1.95美元/百万Tokens;MiniMax官方价格显示,MiniMax M2.7输出端为1.2美元/百万Tokens。轻量档位中,阶跃星辰Step 3.5 Flash按OpenRouter报价为0.10美元输入/百万Tokens、0.30美元输出/百万Tokens,输出端与DeepSeek-V4-Flash的0.28美元/百万Tokens较为接近。
记者看到,OpenRouter上,DeepSeek V4系列模型的调用开始大幅增长,4月26日,DeepSeek V4-Flash的调用量为814亿Tokens,DeepSeek V4 Pro的调用量为96亿Tokens,带动DeepSeek在OpenRouter平台的总调用量创近期新高。
目前,DeepSeek已经引发资本市场对其竞争对手的重新定价。4月27日,两大模型厂商股价重挫,MiniMax股价报收750.00港元/股,跌3.54%;智谱股价报收914.5港元/股,跌2.19%。
此外,DeepSeek近期传出融资消息。有市场消息称,腾讯和阿里正在接触DeepSeek融资事宜,公司估值或超过200亿美元,但具体融资额及估值可能随谈判持续调整。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
28年后愿望已成的蓝牙,战略布局四大发展方向
1998年5月,爱立信、IBM、英特尔、诺基亚以及东芝达成一个共同愿景,成立如今的蓝牙技术联盟,以便能够在全球实施一个互联互通、低成本的无线技术愿景。当时他们的想法是,如果想建立一个全..[详细]
6G现场亮“绝活” 解锁未来新惊喜!
人形机器人“守门员”精准扑球、全息投影实时直播互动、人形机器人与机器狗精彩“热舞”……如果你还觉得6G是遥远的未来概念,走进 2026 全球 6G 技术与产业生态大会打造的沉浸式 6G “黑科..[详细]
华为ICT大赛十年:让每一颗ICT“种子”都能长成参天大树
当前全球围绕AI、云计算、5G、大数据等科技的竞争不断加剧,而科技竞争的根本是人才的竞争,因此中国一直提倡产学研用紧密结合,通过学科知识竞赛、企业出题高校揭榜等方式培养ICT创新型、实..[详细]
预算缩减与 AI 期许, CIO 如何在不确定性高点下应对
“砍预算了。”这可能是近年来,经常听到的一话。Gartner的数据也印证了这点,自2014年开始,中国企业的IT预算占比基本维持在10%左右,但在2018年开始逐步下跌,2025年甚至达到最低点-0.8%,..[详细]
从构想走向现实,6G迈入产业实战新阶段
作为下一代移动通信核心技术,6G正从概念走向现实,其技术突破、产业布局与全球竞争格局牵动业界神经,成为数字经济领域最受关注的赛道。当前,6G正处于从理论与技术研究向面向产业的技术创..[详细]
AI与网络的深度融合,筑牢智能时代发展底座
近日,以“AI 融智,网联万物:共筑智能新纪元”为主题的“2026年·云网智联大会”在北京召开,众多行业专家及企业代表围绕算力基础设施、自智网络、智能IP广域网、智算中心网络、算网安全、..[详细]
人形机器人马拉松,跑出产业新速度!
4月19日,北京亦庄上演了一场特殊的马拉松比赛,一边是人类跑者奋力奔跑,另一边是人形机器人同步疾驰。当机器人稳稳冲过终点线,亦如撞开了科技与现实的边界,宣告人形机器人终于告别实验室..[详细]
6G渐行渐近 全链协同迈向商用
随着 “十五五”规划纲要正式发布,6G 被明确纳入国家未来产业核心赛道,其战略定位完成从前瞻布局到产业培育的关键升级。这标志着 6G 不再是 5G 的简单技术延续,而是以通信、感知、算力、A..[详细]
移动通信的新蜕变,从机器人摆脱遥控器开始
每一年的MWC巴塞罗那过后,在国内总是会有一场Post-MWC思享汇活动,即总结分享巴展上的行业洞见,同时也揭开MWC上海的序幕。值得一提的是,今年的上海展将迎来第13届,GSMA大中华区总裁斯寒..[详细]













