2025年7月28日星期一

首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展

首页 >> 头条资讯 >> 正文

Meta开源AI语言模型MusicGen，可将文本和旋律转化为完整乐曲

2023年6月13日 07:18 IT之家作者：江程（实习）

Meta 近日在 Github 上开源了其 AI 语言模型 MusicGen，该模型基于谷歌 2017 年推出的 Transformer 模型。如同模型名称所示，MusicGen 主要用于音乐生成，它可以将文本和已有的旋律转化为完整乐曲。

研发团队表示：“我们使用了 20000 小时的授权音乐来对训练该模型，并采用 Meta 的 EnCodec 编码器将音频数据分解为更小的单元进行并行处理，进而让 MusicGen 的运算效率和生成速度都比同类型 AI 模型更为出色。”

除此之外，MusicGen 还支持文本与旋律的组合输入，例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

研发团队还对 MusicGen 的实际表现进行了测试。结果显示，与谷歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其他音乐模型相比，MusicGen 在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好，总体而言略高于谷歌 MusicLM 的水平。

Meta 已允许该模型的商业使用，并在 Huggingface 上发布了一个供演示用的网页应用。

编辑：路金娣

声明：刊载本文目的在于传播更多行业信息，本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题，请在30日内与本网联系，我们将在第一时间删除内容。本站联系电话为86-010-87765777，邮件后缀为#cctime.com，冒充本站员工以任何其他联系方式，进行的“内容核实”、“商务联系”等行为，均不能代表本站。本站拥有对此声明的最终解释权。

相关新闻

·提速云端，引领创新 SAP赋能新型中国企业把握三大发展趋势	·中国广电2024年度工作会议:全面实施“1368N”计划
·电信运营商在生成式人工智能生态中的角色定位	·工信部：已推动超1.4亿台国产智能手机和智能电视适老化..
·机构：2024年小芯片市场规模将达44亿美元	·6G行业新标准再出优选布局场景是发展关键
·机构预测2024年5G智能手机市场：Top3格局不变，5G毫米..	·联想高管：三年内摩托罗拉成为全球TOP3手机厂商
·OPPO与诺基亚签署5G专利交叉许可协议双方将结束所有未..	·Canalys发布2024年全球科技行业十大趋势：中国将成为全..
·赋能千行百业工业互联网让数字化具象化	·我国蜂窝物联网用户已有23.32亿户占移动网终端连接数..
·2023年全国移动短信业务量下降0.3% 收入比上年下降0.7%	·全国移动互联网用户达15.17亿户 2023年全年净增6316万户

人物

工信部张云明：大部分国家新划分了中频段6G频谱资源

·信通院曹蓟光：下一代网络研究正..

·信通院张海懿：量子信息技术已进..

·信通院李文宇：医疗仍是脑机接口..

·信通院周兰：元宇宙尚处于早期的..

·中国信通院孟楠：新型内生安全技..

·栗蔚：算力互联互通体系让算力真..

精彩专题

专题丨“汛”速出动共筑信息保障堤坝

2023MWC上海世界移动通信大会

中国5G商用四周年

2023年中国国际信息通信展览会

CCTIME推荐

·崔巍出席省青年企业家助力高质量..

·2023中国企业信用500强发布中天..

·5G、AI等技术创新应用力度加大数..

·FTTR进入规模发展加速期

·400G将在今年实现规模商用

·喜迎开门红！中信科移动中标中国..

·聚焦开源、合作共建：openGauss打..

·中天科技紧急驰援甘肃灾区首批通..

·情暖陇原，共克时艰！亨通紧急驰..

·强基赋智 | 思特奇数据中台数智化..

·重磅！亨通成为全球“灯塔工厂”

·中信科移动积极参加2023全球6G发..

·数据筑基加速产业升级——思特奇..

·亨通量子“江苏省量子保密通信试..

·5G融合创新提档升级构筑产业新优势

关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图

CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1 电信与信息服务业务经营许可证080234号京公网安备110105000771号
公司名称：北京飞象互动文化传媒有限公司
未经书面许可，禁止转载、摘编、复制、镜像