首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

阿里开源模型万相2.1引爆视频赛道!谷歌/微美全息加入全模态AI开源新时代!

2025年3月4日 10:03  CCTIME飞象网  

据报道,阿里(BABA.US)生成基座模型万相2.1(Wan)宣布开源,在评测集中,超越 Sora、Luma等模型,位列榜首。

 

开源最强视频大模型亮相

获悉,万相2.1共有两个参数规模,140亿参数模型适用于对生成效果要求更高的专业人士,13亿参数模型生成速度较快且能兼容所有消费级GPU,两个模型的全部推理代码和权重已全部开源。

在视频生成方面,万相2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能,同时支持文生视频、图生视频、视频编辑、文生图和视频生音频等多项任务。

 

据此前介绍,万相2.1支持中英文视频,可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等。

分析人士称,随着万相2.1模型开源,标志着阿里云实现了全模态、全尺寸的开源。这意味着更多的开发者,将能够低成本获取并使用该模型底层代码,进而用以开展与自身业务相关的各类视频生成应用。

 

开启全模态开源新时代

自2025年以来,开源趋势逐渐成为全球大模型领域的标配。国内方面,进入2月,多家企业纷纷推出了各自的开源模型,包括字节跳动的豆包以及百度的文心一言等,共同掀起了新一轮的开源热潮。

国际方面,随着万相2.1完全开源,OpenAI、谷歌等竞品也将直面商业化的挑战:更好的模型已经开源了,AI生成视频的定价也将面临挑战。谷歌Veo 2模型近期披露定价,每生成1秒视频需要付费0.5美元,相当于生成一个小时的视频需要花费1800美元。

 

微美全息开源多模态应用场景拓展

公开资料显示,微美全息(WIMI.US)在AI视频生成领域有显著布局,涵盖大语言、多模态等领域,面对开源视频生成大模型赛道,从大语言模型到视觉生成模型,从基础模型到多样化的衍生模型,实现了全模态、全尺寸的开源,微美全息AI开源生态的发展正不断被注入强大的动力。

事实上,近些年来,微美全息专注于多模态AIGC(生成式AI)研发,技术核心在于结合大规模预训练与多模态算法优化,提升生成内容的连贯性和物理合理性。同时在行业生态上,微美全息已逐步实现文本生成视频、图像生成视频等能力,支持剧情创作、短视频生成等场景,未来可能通过API或行业解决方案,加速AI快速生成视频能力技术迭代。

 

结语

未来,AI模型将进入一个分水岭,机构普遍认为,阿里此举将加速AI视频技术商业化落地,并推动算力、云计算、内容创作等全产业链升级。所以说,AI下半场,不是简单的技术竞赛,而是一场关于资源、效率和成本的综合博弈,这一新的革命正在加速中。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
vivo胡柏山:手机行业是最典型的新质生产力代表
精彩专题
聚焦2025全国两会
2025年世界移动通信大会
低空经济2025:助力中国经济腾飞,成就高质量发展
2024通信业年终盘点
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像