首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

零一万物大模型和GPT-4V一起识别中文图表,来看看谁赢了

2024年3月26日 15:55  CCTIME飞象网  

近期,Kim宕机的新闻让达模型商业化拼杀进入白热化阶段。与此同时,零一万物API也正式开箱,开发者可以直接调用包括多模态交互、200K超长文本、通用Chat等三大模型促成模型在更多应用场景的落地。

零一万物API开放平台链接:https://platform.lingyiwanwu.com/

目前,Yi大模型API名额已经开放,新用户申请成功即送60元体验。这次,性能更强的多模态模型,更专业的推理模型,和OpenAI API随意切换的兼容性,以及超低的价格,都是不小的惊喜。


针对实际应用场景,多模态模型Yi-VL-Plus能力显著增强,支持复杂图表理解、信息提取、问答以及推理,甚至优于GPT-4V。


如,一张有些重影的图片,让Yi-VL-Plus模型识别这是什么店。

Yi-VL-Plus准确给出了店名“风水鱼自选超市”,并解释了这个店铺是做什么的。

GPT-4V的解释则不太准确,竟然识别成了“风水宝地鉴定中心”,令人哭笑不得。

中文图表的体验中Yi-VL-Plus表现也很优异。新升级模型在Yi-VL基础上进一步提升图片分辨率,支持1024*1024,明显提升了场景中文字、数字OCR识别准确性。比如下面这张分辨率低,表格繁杂的图,提问:“通暖工程的人工单价是多少”,Yi-VL-Plus可以很快给出正确答案:33.054元/工日。

而GPT-4V则在处理照片信息方面遇到了问题,给出了一段似乎是回答的“周边回答”,就是没有呈现准确的数字。

除了表格,Yi-VL-Plus处理饼状图的表现也可圈可点。在面对同样一张饼图,Yi-VL-Plus精确表述了饼图中所显示的内容,并且在数字对应上,没有出现任何错误。

同样的问题交给GPT-4V,表现则不那么乐观,无法正确认出饼状图中的中文字。

综合来看,Yi大模型体验丝滑,可以成为企业和个人的工作好帮手!

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
陈忠岳:中国联通正在开展6G技术指标制定等工作
精彩专题
CES 2024国际消费电子展
2023年信息通信产业盘点暨颁奖礼
飞象网2023年手机评选
第24届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像