首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 人工智能 >> 正文

“DeepSeek时刻”之一:云巨头集中接入背后

2025年2月5日 08:08  北京商报  

2月2日—4日,腾讯云、百度智能云、阿里云前后接入DeepSeek相关大模型,而大厂在春节假期为深度求索公司加班,只是DeepSeek爆火的一个证据。英伟达市值蒸发创纪录、OpenAI上新o3-mini推理模型、DeepSeek卡顿、榜单第一……与深度求索直接间接相关的新闻,在春节期间不断刷新。

单论拥抱DeepSeek,海外同行的动作更快,微软、英伟达、亚马逊科技等在1月底就已接入。据称DeepSeek以3%的成本超越了OpenAI,且开源,这意味着以低成本已可训练出足够好的AI模型。不管是为了客户的多样化需求,还是为了构建AI生态,云厂商快速接入最火的大模型,都是笔划算的买卖。

七巨头集结

“让更多开发者便捷调用DeepSeek,腾讯云再出一把力”,2月4日,腾讯云又一次拉近与DeepSeek的距离,在腾讯云TI平台推出“开发者大礼包”:DeepSeek全系模型一键部署,部分模型限免体验。在此之前,腾讯云已在2月2日宣布将DeepSeek-R1大模型一键部署至腾讯云“HAI”上,开发者仅需3分钟就能接入调用,一改以往慢吞吞的风格。

更早打出低价牌的是百度智能云,2月3日,百度智能云千帆平台正式上架DeepSeek-R1和 DeepSeek-V3模型,并推出超低价格方案,用户还可享受限时免费服务。

北京商报记者了解到,目前腾讯云TI平云采用按量计费和包年包月计费模式,百度智能云千帆平台限时免费2周至2月18日24:00。

阿里云也在春节期间就开了工,“大年初六,我们进入正题”,阿里云以此开场,在2月3日宣布阿里云PAI ModelGallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。

对于费用,阿里云相关人士以全部部署好所需资源为例向北京商报记者介绍,“部署DeepSeek-R1-Distill-Qwen-7B模型的价格约为11.1元/小时(以A10机型为例);部署DeepSeek-R1模型的价格约为316元/小时。模型部署成功后按实例运行时长计费,不满1小时按具体分钟数折算计费”。目前阿里云百炼平台也已上线DeepSeek-R1和DeepSeek-V3模型API,且面向用户限时免费中。

华为云则在2月1日即宣布,硅基流动与华为云团队联合首发并上线基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。

这波比拼中,不在春节假期的海外公司占了先机。

1月31日,英伟达宣布,NVIDIA NIM(一种云原生微服务技术)已经可以使用DeepSeek-R1。微软同日称已将DeepSeek-R1正式纳入Azure AI Foundry,成为该企业级AI服务平台的一部分。

亚马逊云科技(AWS)也宣布:企业和开发者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型,还可以使用AWS Trainium等以经济高效的方式部署 DeepSeek-R1-Distill模型。

春节彩蛋

不是深度求索2025年1月20日发布的DeepSeek-R1,就是2024年12月26日上线的全新系列模型DeepSeek-V3,海内外大厂接入的,正是春节前就在各大主流媒体和社交网站刷屏的大模型“黑马”。

“突然间,美国在人工智能领域相对于中国的领先地位,似乎比自ChatGPT走红以来的任何时候都要小”,英国《经济学人》杂志评论,理由是“一家中国公司(即深度求索)发布了最新的令人印象深刻的大语言模型”。

从数据到体感,印象深刻的例子不难找。

七麦数据显示,1月27日至今,DeepSeek在中国内地免费苹果总榜、应用榜、效率榜均排在第一名,放大到全球榜单,截至北京商报记者发稿,DeepSeek在72个地区的免费苹果总榜、应用榜、效率榜位居榜首。

根据AI产品榜1月31日的数据,DeepSeek上线18天日活用户数1500万,ChatGPT达到同样的数据用了244天,增速是ChatGPT的13倍之多,DeepSeek被公认为是全球增速最快的AI应用。

除了大模型的真本事,春节或许也是DeepSeek加速扩散的原因之一。

2025年1月28日除夕夜,在互联网大厂工作的林悦(化名)把DeepSeek生成的拜年祝福分享在家族群。就这样,DeepSeek被“分发”到天南海北,那晚他给自己及亲戚好友生成了不低于10个新春祝福。第二天,林悦在西北四线城市生活的阿姨告诉他,自己在社交平台刷到了谈论DeepSeek的短视频。

再比如登上热搜第一的话题:“DeepSeek回答如何过好这一生”,它的回复是:“没有完美的人生剧本,所有选择都有代价,关键是要有承担选择的勇气。”北京商报记者也向DeepSeek提出了同样的问题,尝试多次后DeepSeek均显示“服务器繁忙,请稍后再试”,火爆程度可见一斑。

“拼多多”路径

需要强调的是,“中国的大语言模型并非最顶尖的,但它们的制造成本要低得多”,《经济学人》举例,阿里旗下的通义千问QwQ-32B-Preview于2024年11月推出,与美国的顶尖模型相比,差距不到三个月,DeepSeek在一项标准评估中排名第七。

报道称,DeepSeek是由2000多块二流芯片训练而来,Meta的模型则用了1.6万块顶尖芯片。在某些排名中,DeepSeek的表现甚至超过了Meta的模型。训练一个美国的大语言模型成本高达数千万美元,而且还在上升,而DeepSeek方面表示,其训练成本不到600万美元。

提到DeepSeek火爆的原因,工信部信息通信经济专家委员会委员盘和林表示,“DeepSeek采取低价和开源两条路并行的策略,尤其是开源,之前全球AI开发者都要看Meta的脸色,因为最有名的开源模型是Llama,有了DeepSeek,Llama立马不香了,而那些收费较高的,如ChatGPT则受到较大打击,免费和收费哪个香?很容易作出决断,DeepSeek也算中国第一个打通国内国外应用生态的产品”。

“模型成本的下降对产业链上的云服务厂商存在利好”,在比达分析师李锦(金麒麟分析师)清看来,这正是云厂商火速接入DeepSeek的原因,站在市场竞争力与商业价值看,“接入DeepSeek模型有助于云厂商提升自身在AI领域的竞争力,吸引更多开发者和企业客户。通过提供DeepSeek模型的部署和应用服务,云厂商可以拓展业务范围,增加收入来源”。

编 辑:章芳
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
vivo胡柏山:手机行业是最典型的新质生产力代表
精彩专题
2024通信业年终盘点
2024数字科技生态大会
2024年度中国光电缆优质供应商评选活动
2024全球6G发展大会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像