从DeepSeek“上新”看AI演进 大模型将成“全能管家”?
12月1日晚间,DeepSeek一口气发布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个正式版模型。
《科创板日报》记者注意到,此次新发布的DeepSeek-V3.2系列模型,主要强在推理能力的提升。
在Benchmark推理测试中,V3.2与GPT5、Claude 4.5在不同领域各有高低,只有Gemini 3 Pro对比前三者均有较明显优势。
而与月之暗面新发布的Kimi-K2-Thinking相比,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。
对于这次DeepSeek新模型的发布,IDC中国研究总监卢言霞向《科创板日报》记者认为,其将推理能力融入到既有大模型,使得大语言模型、多模态大模型本身就具备推理能力,这也是未来的发展方向,会让模型推理更快,以解决之前纯推理模型速度慢的问题。
快思慢想研究院院长、特邀评论员田丰则向《科创板日报》记者称, DeepSeek新模型降低了推理成本,通过稀疏注意力机制,使128K长上下文推理成本降低数倍,内存占用减少70%。
与此同时,DeepSeek作为开源模型在某些领域实现对闭源模型的反超,通过RL强化学习投入超过预训练投入,以规模化投入强化学习创新路径,直接推动模型在数学推理(IMO金牌)、编程(ICPC世界第二)等硬核任务中达到GPT-5水平。
此外,DeepSeek V3.2模型从“工具调用”迈向“思考型智能体”,实现“文武兼优”。V3.2版本引入“思考保留”模式,支持将工具调用嵌入完整的推理链条中,从而有效规避传统智能体常见的“记忆断裂”问题。比如,面对多步骤复杂任务时,模型能够基于历史工具执行结果持续优化决策,而无需重启推理流程。
技术报告显示,在智能体评测中,V3.2得分高于同为开源的Kimi-K2-Thinking和MiniMax M2。
不过, DeepSeek也承认,与Gemini3 Pro等前沿闭源模型相比,自家模型仍存在一定的局限性。首先,V3.2的世界知识广度仍落后于领先的专有模型,其次在令牌(Token)效率方面,V3.2通常需要更多的令牌才能达到像Gemini3 Pro这样的模型输出质量。在解决复杂任务方面也不如前沿模型。
DeepSeek方面称,团队计划在未来通过增加预训练计算量来填补知识空白,并专注于优化模型推理链的智能密度以提高效率,进一步改进基础模型和训练后方案。
一位AI智能体业内人士在实测后向《科创板日报》记者表示,DeepSeek的多智能体效果优于国内其他模型,而低于谷歌Gemini。
对于DeepSeek近期的新模型都在发力智能体,卢言霞认为,未来的大模型就是智能体平台,这是必然趋势。
“大模型衍生出来的智能体,将首先在部分垂直应用场景落地。然而,要构建系统级的智能体,仍要克服数据、硬件、知识融合与外部生态协同等多重挑战。展望未来,专用的智能体开发平台将应运而生。一个明确的趋势是,基础大模型能力将越来越延伸,进化为可自主行动的智能体。”
从智能体的发展方向上来看,田丰表示,目前在深度思考、调用工具两类发展方向上渐趋融合,同时解决长记忆能力、复杂任务规划能力。
此外,服务执行正在取代信息搜索。田丰表示,初级智能体只能查询信息、缺少执行能力,而以千问app、豆包AI、 DeepSeek等为代表的智能体,则能将购物、支付、物流、社交、娱乐等综合O2O服务融为一体,即是百事通,又是“全能管家”。
田丰还看好智能体解决行业专有问题。“法律、财会、医疗、制造、能源、政务、教育等智能体将成为刚需,万金油不如一招鲜,用户会对解决工作生活刚需的专用智能体更有兴趣,通过通用智能体调用专用智能体也成为一篮子协同模式。”
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
当6G遇见AI,通信如何重塑我们的未来?
在第十三届通信和宽带网络国际会议(ICCBN2025)上,我们就见证了一次源自未来的变革。当来自全球20多个国家的数百位顶尖专家齐聚一堂,不光带来几十场精彩的演讲,还展示了众多突破性技术成..[详细]
技术重构带动产业升级:“5G+工业互联网”交出硬核答卷
在过去五年间,中国从各级政府到各行业企业都在积极探索“5G+工业互联网”,尝试将新一代数字技术深度融入实体经济,实现工业领域的全面升级。在国内电信运营商和ICT产业的大力支持下,中国..[详细]
第五代骁龙8的意义:鲜衣怒马少年时,旗舰本色正当风
两周零三天以后,面对第五代骁龙8的发布,现场观众将会回想起骁龙与年轻用户群体一起狂欢共度的那个决赛夜晚。[详细]
赋能新型工业化,三大运营商都做了啥?
“近年来,我国工业互联网逐步打造了IT(信息技术)、CT(通信技术)、OT(运营技术)、DT(数据技术)“4T融合”的技术产业体系,融合应用拓展至国民经济全部41个工业大类。“近日,在2025..[详细]
存储芯片掀起涨价潮:手机厂商承压 明年换机更贵了?
近日,微博话题 “25 年是买手机最好的节点吗” 登上热搜,引发网友广泛热议。伴随着内存、存储芯片的上涨,手机价格上涨预期增加,不少网友问2025年是否为最佳换机时间。[详细]













