首页|必读|视频|专访|运营|制造|监管|芯片|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|大数据|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

Seed1.6-Embedding模型登顶多榜单SOTA

2025年6月25日 16:17  CCTIME飞象网  

在 AI 技术高速发展的今天,「让机器真正理解世界」的需求从未如此迫切。无论是电商平台的跨模态搜索、智能助手的多轮对话,还是内容平台的精准推荐,底层都依赖一个关键能力——将文本、图像、视频等不同形态的信息,转化为计算机可理解的「向量」,并通过向量间的关联实现高效匹配与检索。

6月24日,火山引擎发布全模态向量化模型 Seed1.6-Embedding,通过三大核心突破,重塑向量化能力边界:不仅在权威测评榜单中包揽中文文本、多模态全面任务的 SOTA 成绩,更首次实现「文本+图像+视频」混合模态的融合检索,并通过自定义指令能力大幅降低业务落地门槛。

从“单模态支持”到“全任务领先”:Seed1.6-Embedding的技术实力

针对行业对多模态深度理解和高效检索的双重需求,团队采用文本继续训练-多模态继续训练-精调的多阶段训练策略,基于海量文本、图文对、视频文对数据,构建多任务数据集,通过指令引导、数据合成、数据增强、分层负样本等混合训练,提升细分场景和复杂任务处理能力,让其成为覆盖全场景的向量化“全能选手”。

全面任务领先:包揽中文文本、图像、视频「三冠」

在最能体现模型泛化能力的权威榜单中,Seed1.6-Embedding 均展现出显著优势:

纯文本任务:在 CMTEB 中文文本向量评测榜单上,模型以75.62高分刷新榜单 SOTA,在检索、分类、语义匹配等通用任务表现持续领跑;

多模态任务:在多模态评测榜单 MMEB_v2中,模型的图片、视频向量化任务双双登顶 SOTA,并实现断层领先。其中在 MMEB_v2 Image 榜单上,模型以77.78的高分领先第二名5.6分;模型新增的视频模态,在 MMEB_v2 video 榜单大幅领先第二名20.1分。

全模态混合检索:支持“文+图+视频”统一向量空间表征

过去,多模态向量化模型往往局限于单模态输入-单模态输出的模式,而真实场景中,用户需求通常是通过混合搜索如文搜图和视频、文图搜视频等方式来精准检索目标内容。Seed1.6-Embedding 突破单一搜索限制:

新增视频向量化能力:支持对人物、动作、场景等视频核心语义的统一表征;

全模态混合检索:支持文本、图像、视频等多形态输入的混合表征,输出的向量能同时保留不同模态的关键特征,真正实现「跨模态搜索无界」。

自定义指令增强:让向量生成“按需而变”

业务落地中,不同场景对向量的关注点往往不同:电商需要突出商品的价格、材质等,新闻平台需要强调事件时间、情感倾向。过去,企业常需投入大量标注数据微调模型,成本高、周期长。

Seed1.6-Embedding 通过指令增强技术,让向量生成更“听话”:用户只需通过定制化指令模板,就能像给模型下任务清单一样,精准引导向量生成更贴合业务目标的表达。这一能力让模型适配新场景从“重训练”变为“轻调整”,低成本支持电商精准推荐、知识问答等多样化需求,实现一模型多场景,灵活随需而变。

从“技术突破”到“场景落地”:火山方舟让能力「触手可得」

好的模型,最终要服务于真实场景。为了让 Seed1.6-Embedding 更快、更省心地服务于实际业务需求,火山方舟同步推出两大支持入口:

火山方舟 API 接口:模型已上线火山方舟控制台,专业开发者可直接调用 API,无需自建模型训练与部署环境,即可快速接入业务场景;

VikingDB 向量数据库:火山方舟旗下 VikingDB 向量数据库已深度集成 Seed1.6-Embedding模型,提供“向量生成+存储+检索”的一站式解决方案,企业无需额外开发,开箱即用。

未来,团队将继续深耕向量化技术。预计2025年下半年,用户可在火山方舟体验中心实现可视化体验和多模态检索,VikingDB 向量数据库也将支持全模态数据自动向量化,并开放图文和视频检索开源项目,助力企业和开发者快速集成到业务场景。火山引擎也将以更开放的姿态,携手企业与开发者,共同探索 “让 AI 理解世界” 的更多可能。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐新闻              
 
人物
韦乐平:大模型时代将开启新一波“光进铜退”
精彩视频
2025MWC上海丨中兴通讯副总裁熊杰就AI万兆全光园区话题进行交流
2025MWC上海|中国信科:全栈算力创新应用 为AI时代构筑数智基石
2025MWC上海丨智能加速度 中兴通讯展台直击
2025MWC上海|京信通信:AI赋能5G-A 重构连接的价值
精彩专题
2025 MWC 上海
2025工业互联网大会
2025世界电信和信息社会日大会
第八届数字中国建设峰会
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像