首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 互联网 >> 正文

“最好的开源大模型”!报道称Meta下周将推出2个小版本Llama 3 为暑期推出正式版铺路

2024年4月9日 10:52  华尔街见闻  

当地时间周一,科技媒体The Information援引一位Meta员工消息报道称,该公司计划在下周推出两个小型的Llama 3大语言模型(LLM),作为夏季推出正式版Llama 3的先行版本。

这两个小模型的发布,预计将为Llama 3的正式亮相进行铺垫。Meta在去年7月份发布了Llama 2,此后,包括谷歌、马斯克旗下的xAI与Mistral等在内的数家公司发布了开源的大语言模型,竞争十分激烈。

Llama 3直接对标OpenAI的GPT-4,后者已经成为一个强大的多模态模型,不仅能够处理更长的文本,还支持图像输入。

报道称,正式版Llama 3也将支持多模态处理,即同时理解和生成文本及图片;而先行推出的两个小版本则不具备这一能力。

一般而言,较小的模型成本更低,运行更快,尤其在运行大型模型成本高昂的当下,其价值尤为凸显。小型模型还便于开发者在移动设备上开发人工智能软件。

Meta此前已推出三个版本的Llama 2,其中最大的一个拥有700亿个参数,另外两个版本分别拥有130亿和70亿个参数。

据硬AI此前文章,Llama 3的最大版本可能会拥有超过1400亿个参数。

Meta还将在Llama 3中改进Llama 2在响应争议性话题时过于保守的问题,研究人员计划放松大模型在这一方面的限制,以便它更多地与用户互动,提供背景信息,而不仅仅是拒绝回答。

编 辑:章芳
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
陈忠岳:中国联通正在开展6G技术指标制定等工作
精彩专题
CES 2024国际消费电子展
2023年信息通信产业盘点暨颁奖礼
飞象网2023年手机评选
第24届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像