首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

快手“快意大模型”获信通院5级评估

2024年6月28日 18:08  CCTIME飞象网  

在近日举办的“可信AI·南京人工智能产业发展论坛”上,中国信息通信研究院(中国信通院)正式揭晓了“可信AI”大模型评测结果,快手“快意大模型”(KwaiYii-175B)在其组织的可信AI大模型评测中荣获最高等级——5级评估,这也是国内首个获得“大语言模型专项”5级评估的大语言模型,彰显了其在人工智能领域的技术创新实力与行业领先地位。

「快意」是快手大模型团队自主研发的大语言模型,能够实现高效的自然语言理解和文本生成,为复杂的知识问答、文案创作、实时翻译、逻辑推理,以及代码编写与分析等任务提供强大支持。

自去年 8 月份快手发布自研大语言模型「快意」(KwaiYii)-13B 版本以来,半年内快手又相继研发了 66B、175B 版本的大模型,用以适配不同的业务场景的需求。经过数万亿 Tokens 训练的快意大模型在 MMLU、C-Eval 等中英文权威榜单上均取得了行业领先的成绩,在实际用户体验和反馈中可以看到,快意 175B 的模型效果已显著超越了 ChatGPT-3.5,并达到了接近 GPT-4 的水平。

据介绍,“快意”模型通过硬件优化与混合并行算法的结合,实现了GPU集群算力利用效率超50%的提升,同时将推理成本有效控制在开源方案的十分之一,极大地推动了AI应用的经济性和实用性。

在数据处理层面,“快意”模型成功将PB级别的原始数据精炼为TB级高质量训练集,不仅大幅度降低了数据处理的负担,还通过课程学习式的组织方式,确保了模型训练的高效与平稳。此外,该模型覆盖了广泛的领域知识,进一步强化了其在多元化应用场景中的适应能力。

算法创新是快手此次获奖的关键。据悉,快手与国内外顶尖学术机构携手,共同提出了Temporal Scaling Law理论,为超参数优化提供了新的理论支撑。同时,通过创新集成Scaffold-BPE、MiLe Loss等务实高效的前沿算法,快手在提升模型预训练效率和效果上取得了重大进展。

在对齐技术上,快手采用Rejection Sampling等技术显著改善了数据质量,并通过多样本Packing、Iterative DPO/PPO、细粒度Loss等策略,有效提高了训练的稳定性和模型性能。在解码策略上,提出了创新性的并行解码预测策略,大幅提升了推理速度。

接下来,快手还将在即将召开的2024世界人工智能大会(WAIC)上,举办以“新AI·新应用·新生态”为主题的大模型技术生态论坛。届时,快手将发布最新的大模型技术与应用战略,包括快手大模型技术矩阵全景、基座模型技术创新、应用和落地情况等。

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
邬贺铨:大模型下沉到手机 将激活万亿元规模手机产业
精彩专题
CES 2024国际消费电子展
2023年信息通信产业盘点暨颁奖礼
飞象网2023年手机评选
第24届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像