首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

首届中国数字人大会召开 快手分享数字人技术创新及产业应用

2024年9月25日 16:55  CCTIME飞象网  

近日,2024(首届)中国数字人大会于北京召开,本次大会以“数字人应用与未来”为主题,汇聚了政府相关主管部门领导、院士专家、国内外数字人产业领军企业代表等,共话数字人未来发展及技术创新。大会开幕式上,快手视觉生成与互动中心负责人万鹏飞受邀出席,并发表主旨演讲《多模态数字人的技术创新与产业应用》。

万鹏飞表示,经过多年的技术研发,快手已构建起了完备的多模态数字人解决方案。具体而言,多模态数字人按照不同的输入形式,可分为传感器、文本/音频、视频、多模态综合四大驱动形式。其中,具备完整多模态输入输出能力的多模态数字人,相较而言效果上限更高,技术难度更大。

在此背景下,快手基于自研数字人采集建模、绑定、动捕驱动、大模型生成互动、交互渲染等技术,全面打造多模态数字人解决方案。他介绍称,数字人可应用于商业化、本地生活、电商、招聘等多元场景,主要分为身份型和服务型两种类型。

以快手官方虚拟主播“关小芳”为例,作为身份型数字人的典型应用,其打通了ASR、VLM、LLM等多个自研大模型能力,具备多模态感知、决策、生成能力,互动延时低于2秒且支持用户打断。卓越的性能表现和极低的推理时延使其广泛应用于快手财报解读等多种场景,并在快手平台吸引了超200万粉丝的关注。

同时,针对服务型数字人,快手打造了“快手智播”生成式数字人平台,支持超1000种数字人形象,用户只需提供3分钟视频素材,即可完成个性化数字人的生成。

万鹏飞介绍,除形象生成外,该平台融合了语音、图像及大模型等多种人工智能技术,具备直播/离线视频制作、配套脚本生成、素材管理等能力,打造低门槛、智能化的内容生产体验。一方面,平台所生成的数字人可帮助商家在快手实现云端实时驱动快速开播,打造7×24小时日不落直播间,增强用户观看体验;另一方面,对比真人主播,快手生成式数字人每月投入成本不足真人的20%,且支持万路以上直播间并发。目前,“快手智播”平台服务商家数已破万,数字人直播及短视频日均消耗规模超2000万。

随着AI大模型时代的来临,AIGC正在推动整个行业迈向更加高效、有创意的新纪元。万鹏飞表示,接下来,快手也将大力推动技术创新与产业发展,让多模态数字人更精美、更有智商和情商,为更多数字人应用场景带来更大的业务收益,也为人们的生活带来更多的便利。

应对AI技术迅猛发展的趋势及业界对前沿技术的迫切需求,聚焦新一代大模型的关键技术研发,未来,快手也将进一步夯实基座模型硬实力,持续坚持技术创新,为推动我国数字人产业的技术进步和创新发展贡献更大的力量。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
中国电信邵广禄:面向AI大模型的智算集群及网络的实践和展望
精彩专题
2024年国际信息通信展
中国信科亮相2024年国际信息通信展
第25届中国国际光电博览会
2024年上半年运营商业绩盘点
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像