“DeepSeek时刻”之一：云巨头集中接入背后 -- 飞象网

2月2日—4日，腾讯云、百度智能云、阿里云前后接入DeepSeek相关大模型，而大厂在春节假期为深度求索公司加班，只是DeepSeek爆火的一个证据。英伟达市值蒸发创纪录、OpenAI上新o3-mini推理模型、DeepSeek卡顿、榜单第一……与深度求索直接间接相关的新闻，在春节期间不断刷新。

单论拥抱DeepSeek，海外同行的动作更快，微软、英伟达、亚马逊科技等在1月底就已接入。据称DeepSeek以3%的成本超越了OpenAI，且开源，这意味着以低成本已可训练出足够好的AI模型。不管是为了客户的多样化需求，还是为了构建AI生态，云厂商快速接入最火的大模型，都是笔划算的买卖。

七巨头集结

“让更多开发者便捷调用DeepSeek，腾讯云再出一把力”，2月4日，腾讯云又一次拉近与DeepSeek的距离，在腾讯云TI平台推出“开发者大礼包”：DeepSeek全系模型一键部署，部分模型限免体验。在此之前，腾讯云已在2月2日宣布将DeepSeek-R1大模型一键部署至腾讯云“HAI”上，开发者仅需3分钟就能接入调用，一改以往慢吞吞的风格。

更早打出低价牌的是百度智能云，2月3日，百度智能云千帆平台正式上架DeepSeek-R1和 DeepSeek-V3模型，并推出超低价格方案，用户还可享受限时免费服务。

北京商报记者了解到，目前腾讯云TI平云采用按量计费和包年包月计费模式，百度智能云千帆平台限时免费2周至2月18日24：00。

阿里云也在春节期间就开了工，“大年初六，我们进入正题”，阿里云以此开场，在2月3日宣布阿里云PAI ModelGallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。

对于费用，阿里云相关人士以全部部署好所需资源为例向北京商报记者介绍，“部署DeepSeek-R1-Distill-Qwen-7B模型的价格约为11.1元/小时（以A10机型为例）；部署DeepSeek-R1模型的价格约为316元/小时。模型部署成功后按实例运行时长计费，不满1小时按具体分钟数折算计费”。目前阿里云百炼平台也已上线DeepSeek-R1和DeepSeek-V3模型API，且面向用户限时免费中。

华为云则在2月1日即宣布，硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。

这波比拼中，不在春节假期的海外公司占了先机。

1月31日，英伟达宣布，NVIDIA NIM（一种云原生微服务技术）已经可以使用DeepSeek-R1。微软同日称已将DeepSeek-R1正式纳入Azure AI Foundry，成为该企业级AI服务平台的一部分。

亚马逊云科技（AWS）也宣布：企业和开发者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型，还可以使用AWS Trainium等以经济高效的方式部署 DeepSeek-R1-Distill模型。

春节彩蛋

不是深度求索2025年1月20日发布的DeepSeek-R1，就是2024年12月26日上线的全新系列模型DeepSeek-V3，海内外大厂接入的，正是春节前就在各大主流媒体和社交网站刷屏的大模型“黑马”。

“突然间，美国在人工智能领域相对于中国的领先地位，似乎比自ChatGPT走红以来的任何时候都要小”，英国《经济学人》杂志评论，理由是“一家中国公司（即深度求索）发布了最新的令人印象深刻的大语言模型”。

从数据到体感，印象深刻的例子不难找。

七麦数据显示，1月27日至今，DeepSeek在中国内地免费苹果总榜、应用榜、效率榜均排在第一名，放大到全球榜单，截至北京商报记者发稿，DeepSeek在72个地区的免费苹果总榜、应用榜、效率榜位居榜首。

根据AI产品榜1月31日的数据，DeepSeek上线18天日活用户数1500万，ChatGPT达到同样的数据用了244天，增速是ChatGPT的13倍之多，DeepSeek被公认为是全球增速最快的AI应用。

除了大模型的真本事，春节或许也是DeepSeek加速扩散的原因之一。

2025年1月28日除夕夜，在互联网大厂工作的林悦（化名）把DeepSeek生成的拜年祝福分享在家族群。就这样，DeepSeek被“分发”到天南海北，那晚他给自己及亲戚好友生成了不低于10个新春祝福。第二天，林悦在西北四线城市生活的阿姨告诉他，自己在社交平台刷到了谈论DeepSeek的短视频。

再比如登上热搜第一的话题：“DeepSeek回答如何过好这一生”，它的回复是：“没有完美的人生剧本，所有选择都有代价，关键是要有承担选择的勇气。”北京商报记者也向DeepSeek提出了同样的问题，尝试多次后DeepSeek均显示“服务器繁忙，请稍后再试”，火爆程度可见一斑。

“拼多多”路径

需要强调的是，“中国的大语言模型并非最顶尖的，但它们的制造成本要低得多”，《经济学人》举例，阿里旗下的通义千问QwQ-32B-Preview于2024年11月推出，与美国的顶尖模型相比，差距不到三个月，DeepSeek在一项标准评估中排名第七。

报道称，DeepSeek是由2000多块二流芯片训练而来，Meta的模型则用了1.6万块顶尖芯片。在某些排名中，DeepSeek的表现甚至超过了Meta的模型。训练一个美国的大语言模型成本高达数千万美元，而且还在上升，而DeepSeek方面表示，其训练成本不到600万美元。

提到DeepSeek火爆的原因，工信部信息通信经济专家委员会委员盘和林表示，“DeepSeek采取低价和开源两条路并行的策略，尤其是开源，之前全球AI开发者都要看Meta的脸色，因为最有名的开源模型是Llama，有了DeepSeek，Llama立马不香了，而那些收费较高的，如ChatGPT则受到较大打击，免费和收费哪个香？很容易作出决断，DeepSeek也算中国第一个打通国内国外应用生态的产品”。

“模型成本的下降对产业链上的云服务厂商存在利好”，在比达分析师李锦（金麒麟分析师）清看来，这正是云厂商火速接入DeepSeek的原因，站在市场竞争力与商业价值看，“接入DeepSeek模型有助于云厂商提升自身在AI领域的竞争力，吸引更多开发者和企业客户。通过提供DeepSeek模型的部署和应用服务，云厂商可以拓展业务范围，增加收入来源”。