首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

火山引擎正式发布豆包.语音模型创业者加速计划

2024年11月15日 10:30  CCTIME飞象网  

近日,火山引擎正式发布“豆包.语音模型创业者加速计划”,面向初创企业提供语音合成、声音复刻和语音识别等大模型资源支持,入选企业可获得3个月免费试用、价值4.7万元的语音大模型服务。该计划希望通过开放豆包语音大模型能力,加速AI语音相关新产品研发,助力人工智能初创生态更加繁荣。目前火山引擎官网已开启企业认证申请入口。

image.png

3大语音模型能力,数千小时及千万字支持

该计划针对人数少于30人,以及将AI语音能力融入新产品研发并长期迭代的初创企业。具体而言,火山引擎通过API调用等方式开放豆包.声音复刻模型、豆包.语音合成模型、豆包.语音识别模型等热门能力,共计数千小时及千万字支持。企业可登录火山引擎官网申请,通过企业认证之后填写申请表,工作人员将在10个工作日进行审核,并对审核通过的企业发放支持资源代金券。获得代金券后3个月内,初创企业可通过火山引擎官网控制台及接口文档接入豆包语音大模型能力,兑换免费额度,用于AI语音相关应用或产品的研发。

AI语音场景加速,助力良性生态发展

调研显示,在发展“人工智能+”的大背景下,出于技术门槛和资金投入等因素,中小初创企业亟需更加广泛深入的基础设施和平台支撑。

豆包语音大模型致力于多个语音场景的深耕,聚焦陪伴式AI交互、沉浸式听书、跨语种内容生产、企业客户服务等场景,为企业级客户提供丰富的语音能力:

豆包.语音合成模型:根据上下文智能预测文本的情绪、语调等信息,并生成超自然、高保真、个性化的语音,以满足不同用户的个性化需求。

豆包.声音复刻模型:全新自研语音大模型算法打造的高效化的轻量级音色定制方案。仅需只需5秒数据,即可完成对用户音色、说话风格、口音和声学环境音的复刻,并进行跨语种迁移。

豆包.语音识别模型:拥有更加灵敏的耳朵+更加聪明的大脑,通过上下文感知功能进行推理,识别效果更加精准,同时支持上海话、闽南语等多种方言识别。

目前,火山引擎豆包语音大模型能力已在豆包APP、剪映、抖音、番茄小说等多款内部产品展开应用,并逐渐向企业开放以拓展更多AI语音应用场景。大模型技术不断演进成熟,推动人工智能向产业渗透,而初创企业正是应用创新的重要前线。火山引擎将持续推动字节跳动AI能力外溢,以成熟的大模型和平台工具,以及广泛的生态支持,助力广大初创企业成长,实现人工智能时代的共同繁荣。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
爱立信中国区总裁方迎:新质网络创造新质价值
精彩专题
2024中国算力大会
2024年国际信息通信展
中国信科亮相2024年国际信息通信展
第25届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像