DeepSeek更新“前夜”,有些问题得提前理一理
4月10日,据多位知情人士向《创智记》透露,DeepSeek创始人梁文锋在内部沟通中首次明确了V4的发布节奏——备受期待的新一代旗舰大模型DeepSeek V4计划于4月下旬正式与公众见面。
凤凰网科技就此消息向DeepSeek方面询问,截至发稿未取得回应。
此前,DeepSeek刚刚完成版本更新。首次在模式上进行分层,推出了快速和专家两个模式。在点击开始入口处,原本“体验DeepSeekV3.2”的字样也消失不见了。
优等生DeepSeek的烦恼
DeepSeek V4的扑朔,建立在一个复杂的背景之上。
2025年初,R1的发布,曾经是国内大模型创企挥之不去的“阴影”。用了半年时间,这些曾经的明星企业才凭借新的旗舰模型回到公众视野,或上市、或开启新一轮融资。
在成名前,梁文锋曾与少部分VC进行过会谈,但据当时与其有过接触的人士向凤凰网科技表述,梁文锋的本意也不是融资,而是看看机构的风格。
《晚点LatePost》也在报道中写道,梁文锋曾在会面中提出类似OpenAI与微软投资协议的回报上限条款,但无机构接受,此后再无投资人会面。
2025年成名后,DeepSeek的风格是更加对内收敛,一些原本在社交媒体更新的员工账号开始停更。
据《晚点LatePost》报道,DeepSeek不加班,他们不打卡、没有明确的绩效考核,平日多数成员会在下午6点至7点左右离开公司。
但随着智谱、MiniMax等公司上市后激增的市值,DeepSeek的估值问题正成为内部压力点。DeepSeek员工对手中未定价的期权有了更多疑问,梁文锋近期开始考虑公司估值的问题。
除此之外,从2025年秋天起,梁文锋开始更多提及“产品化和商业化”。在公开的招聘信息中,官方HR也表述有产品、设计、数据百晓生等岗位开放。甚至是职能岗也在扩充, 早在2025年11月,DeepSeek还开放过行政招聘,据相关人士表述“是因为团队大了,需要更多的行政伙伴”。
变化之下,可能让拖延数月的V4存在诸多变数,但其掀起的热潮不会迁移。
OpenRouter平台数据显示,2026 年 2 月,中国大模型在 OpenRouter 上周调用量首次超过美国模型,这一态势一直持续到3月。本周,排在前五位的模型,依旧有三个来自中国,分别是排名第一的DeepSeek V3.2和排名第二的MiniMax M2.7和第四的MiniMax M2.5。
毫无疑问,DeepSeek V4的到来,有望延续这份优势。
V4算不算DeepSeek的分水岭?
把R1和V4放在一起看,这个变化的轮廓会变得更清晰。
R1的突破是范式性的——它在学术层面开创了“纯强化学习激发推理能力”的新路径,论文登上Nature封面,以586万美元的成本实现了对标GPT-4的性能,彻底改变了全球对中国AI模型的认知。
Hugging Face在“DeepSeek时刻一周年”回顾中指出,R1“降低了技术与应用门槛,不仅是中国AI发展的转折点,更在全球范围内引发了开源模式的深刻变革”。
V4的战略意义截然不同。它不再回答“中国能不能做出世界级模型”,而是在回答两个更具体的问题:“中国AI能不能在算力封锁下持续进化”,以及“大模型能不能变成能赚钱的企业级产品”。
所以,V4算不算DeepSeek的分水岭?
如果说R1是DeepSeek在“纯推理”路线上站住脚、打响全球名声的第一枪,那么V4就是DeepSeek证明自己不只是“技术奇才”、而是能在中国AI产业生态中找到不可替代位置的标志性产品。
R1的意义在于“做了一件别人觉得中国公司做不了的事”。V4的意义在于“在一个被封锁的环境中,自己铺了一条能走下去的路”。
与此同时,站在学术界,新的风向也在产生。DeepSeek的使命一度是探索未知,追求AGI。
去年底,姚顺雨、林俊旸、杨植麟、唐杰等人在清华同台,探讨的是底层范式的话题。在海外,Yann LeCun言称LLM是“死胡同”,Jim Fan说“视觉是连接大脑、运动系统和物理世界的最高带宽通道”。甚至一些观点认为,追求AGI的重任或许该落在世界模型身上了。
敏感的VC,是最早嗅到市场风向的人。颇为巧合的是,代表世界模型阵营的李飞飞和杨立昆,均刚刚完成10亿美元级别的新融资,国内代表生数科技4月10日也刚刚官宣获得了A++轮融资,融资金额近20亿人民币。
就目前披露的信息而言,DeepSeek选择的仍然是基于LLM架构的优化和工程化落地。而V4最核心的突破是集中在这三件事上:万亿参数MoE架构、原生多模态能力和国产芯片适配。
对于DeepSeek来说,在算力和资金都存在约束的情况下,把资源投向架构效率和国产化适配,比追逐一个距离产品化还很遥远的范式,更务实、更符合它“少花钱办大事”的底色。
值得注意的是,DeepSeek并非完全没有多模态的积累。此前开源的DeepSeek-OCR系列已经展示了将视觉作为文本压缩媒介的探索,通过将文本以图片方式输入,极大减少token消耗。
但这些探索的方向仍然是“优化文本模型的效率和成本”,而不是“构建对物理世界的理解和预测”。
如果拉长时间线来看,DeepSeek的这条“分水岭”可能还有更深的一层含义——它不是一条岔路,而是一道选择题:在中国AI产业的现实土壤上,是追随“世界模型”的范式革命,还是在现有架构上把工程优化和自主可控做到极致?
当然,如果DeepSeek未来真的在视觉和空间推理上投入更多资源,以它的架构创新能力,切入“轻量级世界模型”领域并非不可能。但在当下,V4的任务很清楚:在中国AI产业最需要的方向上,交出一份能打的答卷。
这个选择是否成立,不需要等太久。4月下旬V4正式发布后,市场的反馈会给出最诚实的答案。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
做AI时代“价值贡献者”:中兴通讯如何以“连接 + 算力”双轮驱动?
今年三月发布的财报显示,2025年中兴通讯营收1339亿元,同比增长10.4%,归母净利润56.2亿元,业绩非常亮眼。在这份财报的背后,是中兴通讯加大智算业务投入,形成了覆盖“基础设施—平台—应..[详细]
专家谈6G:空天地一体化,正迈入全新高速发展期
在2026年3月举行的西班牙巴塞罗那MWC大会上,不少厂商已经开始谈论6G愿景,那么业界对于6G究竟有哪些设想?4月21-23日,2026全球6G技术与产业生态大会将在南京召开,全球顶尖学术力量与产业..[详细]
智能手机砍单瞄准中低端型号,多重因素收窄市场预期
智能手机砍单瞄准中低端型号,多重因素收窄市场预期[详细]
中国Token调用量全球登顶,正在快速彻底甩开美国
我国的AI大模型在近来的周调用量上,已经连续第五周超越美国。截至2026年4月6日,根据最新数据,从3月30日至4月5日这一周里,中国AI大模型周调用量是12.96万亿Token,环比增长31.48%,而美国..[详细]
低空产业发展将呈现三阶段发展态势
随着新一轮科技革命和产业变革深入发展,低空经济作为一种新兴经济形态,通过重大技术突破和创新应用开拓新产业、新模式、新业态,逐步成为加快建设现代化经济体系、增强我国国际竞争力的关..[详细]
直击数智化创新一线:探访河南向新之力
数智浪潮奔涌向前,创新动能生生不息。近日,飞象网记者跟随“数智河南 多彩中原”河南新质生产力主题媒体探访活动赶到郑州、开封等地,直击数智化创新一线。从农业生产到乡村管理,从文旅产..[详细]
敲开苹果护城河,安卓厂商聚焦兼容苹果生态
要说苹果iPhone的优势在哪?很多用户最舍不得抛弃的一点莫过于与Mac、iPad设备的优秀生态兼容性,无论是一点即传的AirDrop,还是随时自动同步iCloud,这一生态能力某种程度上也成为苹果维持..[详细]
6G要爆发?原型机密集发布,6G三大技术集体亮相
2026年以来,全球6G发展加速驶入快车道,6G的标准制定、原型研发、技术突破、产业规划等均取得标志性进展。3GPP已启动6G标准起草工作,进入规范制定关键窗口;ITU也发布相关报告,明确6G关键..[详细]
三大运营商2025年报:营收稳中有进 算力等新兴产业成效显现
近日,中国移动、中国电信、中国联通三大电信运营商2025年年度报告已全部对外披露。作为我国数字经济发展的“国家队”与主力军,三大运营商在2025年顶住行业竞争加剧、传统业务增长趋缓等多..[详细]













