2025年3月21日,在华为中国合作伙伴大会 · 昇腾人工智能伙伴峰会上,昇腾AI携手22家伙伴正式推出大模型应用一体机系列产品,满足企业轻量化AI部署的核心需求。

大模型应用一体机系列产品依托昇腾AI基础软硬件平台,通过软硬协同优化与场景化封装,深度融合算力硬件、算法模型及部署工具,具备高性能、易部署的特点,显著降低AI应用门槛,为企业提供标准化、轻量化的解决方案。
为更好地支持伙伴打造更具竞争力的大模型应用一体机产品,昇腾AI在基础架构层持续创新:
●推理加速优化:搭载MLA(混合精度加速)融合算子、混合并行加速架构及向量检索加速技术,推理吞吐性能较传统方案提升90%,支撑高并发实时场景需求。
●部署效率升级:提供适配量化权重文件、自动化推理调优套件及一键式部署工具,模型适配与部署时间缩短50%。
●应用敏捷上线:支持vLLM框架,实现固件、驱动及软件的自动化管理,支持一键式升级与标准化接口调用,帮助企业快速完成AI应用上线。
大模型应用一体机的发布,不仅是昇腾与伙伴技术协同的里程碑,更是产业智能化进程的加速器。未来,昇腾将与伙伴深化协同创新,与千行万业的探索者并肩前行,让AI技术更简单、更高效地融入企业核心业务场景,共同推动智能化从“可选项”迈向“必选项”,为产业升级注入新动能。