关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者17人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

秦海璐直觉超准!刘宇宁35岁面相改变

智凌纵横 浏览 71

亨通光电财运亨通

富凯财经 浏览 18

伊朗外长:就伊朗核问题达成协议的唯一途径是外交

国际在线 浏览 12

台铃入局新能源休闲三轮车赛道:发布三款新品,搭载太阳能系统

IT之家 浏览 55

NBA生涯最后一场比赛!沃尔12投6中&三分4中2 得到16分7板4助1断

直播吧 浏览 82

曝古二家人被骚扰!90多岁外婆被人找上门,难怪放录音重锤王家卫

萌神木木 浏览 1051

奇瑞汽车:风云 X3 系列采用全铝车身,未来深耕方盒子赛道

IT之家 浏览 77

罗德里:我不是梅西,不能一回来就让球队不断赢球

懂球帝 浏览 65

宇树春晚同款机器人双金 "全自主"天工摘银

澎湃新闻 浏览 87

今日最难得,我们十一周年啦!

黎贝卡的异想世界 浏览 53

萧美琴在欧洲议会大楼参加会议并讲话 外交部回应

澎湃新闻 浏览 25

美国突袭委内瑞拉后,这些个股推动欧股创下历史新高

第一财经资讯 浏览 18

女子毕业24年后起诉母校多收4000元学费 要求退一赔十

大风新闻 浏览 23

伊姐周六热推:电视剧《许我耀眼》;电视剧《命悬一生》......

伊周潮流 浏览 61

王家卫持续被扒!《东邪西毒》事件推锅临时工

boss外传 浏览 1132

实拍斯巴鲁PERFORMANCE-B STI概念车:传奇随时可以复活,无奈量产成本太高

驾仕派 浏览 25

霍里谈申京质疑勇士:库里的比赛能提高收视率 火箭应预料到这点

直播吧 浏览 72

半导体再掀涨停潮!“上行周期”成多家公募共识

券商中国 浏览 87

世体:拉波尔塔周一中午抵达体育城,向球队重申支持和鼓励

懂球帝 浏览 47

英特尔承认 Arrow Lake 桌面处理器缺乏竞争力

IT之家 浏览 82

好久没对一双鞋这么心动了!

黎贝卡的异想世界 浏览 67
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12