必读视频专题飞象趣谈光通信人工智能低空经济5G手机智能汽车智慧城市会展特约记者

豆包App视觉推理升级 支持图片思考

2025年7月30日 10:12CCTIME飞象网

据悉,豆包App视觉推理能力已于近期升级,支持在思维链中运用图像思考。

现在,当用户在豆包App中上传图片并提出问题时,豆包不再是简单地“看”图,而是能主动“思考”如何更好地分析这张图片。例如,如果图片中包含需要仔细辨认的文字或细小物品,豆包会智能地对图片进行局部放大,确保不遗漏任何关键信息。同时,对于那些画面复杂、信息量大的图片,豆包也能够在思考过程中智能裁剪,并调用搜索进行文搜图、图搜图等,为用户提供更准确的结果。

据介绍,升级后豆包能更智能地调用多种工具对图片进行辅助分析。无论是日常生活中遇到的花草树木识别、商品信息查询,还是工作学习中对图表数据、专业图片的分析,豆包都能给出更精准、更实用的答案。

今年初,ChatGPT发布最新的o3模型时,首次实现将图像融入思维链中,将高级推理与网页搜索和图像处理(自动缩放、裁剪、翻转或增强图像)等工具无缝结合。据了解,豆包为国内首个实现这一能力的产品,用户可免费体验。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐阅读

精彩视频

精彩专题

关于我们广告报价联系我们隐私声明本站地图

CCTIME飞象网 CopyRight © 2007-2025 By CCTIME.COM

京ICP备08004280号-1 电信与信息服务业务经营许可证080234号 京公网安备110105000771号

公司名称: 北京飞象互动文化传媒有限公司

未经书面许可,禁止转载、摘编、复制、镜像