首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 头条资讯 >> 正文

京东云全面上线 DeepSeek-R1 / V3 模型,支持公有云在线部署、专混私有化实例部署

2025年2月5日 07:22  IT之家  作 者:清源

京东云昨日宣布,京东云已正式上线DeepSeek-R1 和 DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。

附两种部署方式:

公有云在线部署

开发者和企业可以在京东云官网,进入言犀 AI 开发计算平台的“AI 资产市场”中,选用该模型进行一键部署。

言犀 AI 开发计算平台已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署,具体步骤如下:

1、选择基础模型在“AI 资产市场 / 模型”中,提供 DeepSeek 开源的多个版本,如 DeepSeek-R1-Distill-Qwen-1.5B,点击进入卡片页可了解模型结构和预训练数据等关键信息,并查看模型文件结构。

2、准备资源节点 在部署时,LLM 模型因为模型较大,资源性能要求较高,需要独占计算卡进行部署,建议提前准备好专属资源节点。功能路径:专属资源组-创建资源组-创建节点。节点规格:部署 DeepSeek-R1-Distill,推荐使用 cap.p.n3a30.4xlarge;部署 DeepSeek-V3,推荐使用 cap.hc.p5h20.46xlarge

3、模型部署使用将模型部署到相应的服务资源上提供推理调用服务,在部署时平台将自动适配预置推理框架,实现一键部署,仅需指定使用的专属资源组和对应的节点规格。部署完成后,状态将会变为运行中,运行中的模型可被调用,提供推理服务。功能路径:专属资源组-创建资源组-创建节点在线服务-部署;在线服务-服务列表 | 服务名称-在线调试

私有化算力实例部署

专混私有化算力实例部署模式,已经同步上线京东云 vGPU AI 算力平台,为金融、企业、政府等客户提供数据不出域的私有化模型推理服务。

以 DeepSeek R1 版本为例,具体的使用步骤如下:1、进入算力管理页面,点击租用新实例按钮

2、选择资源规格以及对应带有 deepseek 模型的镜像

3、资源创建成功后通过 Jupyterlab 进入实例,启动 Ollama 即可与之对话

京东云言犀 AI 开发计算平台还支持私有化部署及 API 快速集成,通过自研高性能资源管理与弹性调度系统,可提供大模型的全生命周期服务及部署,涵盖模型开发、推理及多场景应用扩展。

针对资源紧缺的场景,京东云支持通过蒸馏技术训练企业自己的大模型,减少模型部署所需资源的同时具备较好的性能。使用京东云 vGPU AI 算力平台,可以将多个蒸馏过的企业自有模型部署在同一张卡上,有效提升资源利用率 70%。

编 辑:章芳
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
vivo胡柏山:手机行业是最典型的新质生产力代表
精彩专题
2024通信业年终盘点
2024数字科技生态大会
2024年度中国光电缆优质供应商评选活动
2024全球6G发展大会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像