关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者14人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这不是危言耸听:最快明年,比亚迪的插混和纯电,就没有区别了

小李车评李建红 浏览 45

快速扩张难走通?益丰药房上半年营收首降,新增门店数大减

时代周报 浏览 71

泽连斯基向特朗普展示俄境内潜在打击目标地图

环球网资讯 浏览 60

深圳福田首批"政务龙虾"上线 仅有3000多行代码

红星新闻 浏览 8

关于A股,1张真正的“寻宝图”

路财主 浏览 79

2026年开年看什么?这些新剧已经帮你挑好了

桃桃淘电影 浏览 25

光伏“卖铲人”去年净利腰斩

网易财经 浏览 21

鲁比奥宣布任命新任美"西藏特别事务协调员" 中方回应

扬子晚报 浏览 13

小S哽咽念不了台词!具俊晔「悄现身」低调陪伴

达达哥 浏览 70

猪肉消费大变革!爱尔兰猪肉抢占新赛道

餐饮老板内参 浏览 33

Labubu卖爆全球,泡泡玛特半年大赚47亿

达摩财经 浏览 71

飞行学员与十几名女子发生关系发下体照 怀孕女友崩溃

社会酱 浏览 73

美被指向以色列通报对伊朗行动准备进展

每日经济新闻 浏览 18

四名日本U17国脚在阿贾克斯试训,并与富安健洋、板仓滉合影

懂球帝 浏览 12

瑞尔竞达:募投项目新增产能信披现疑云 同产品或上演“又拆又建”异象

金证研 浏览 86

美军连扣两艘油轮 美方:都是委内瑞拉“影子舰队”

新华社 浏览 20

女子被日料店服务员泼开水烫伤:事发后曾接到警告电话

封面新闻 浏览 60

新款问界M7官图发布:设计更精致,纯电版终于来了

极智动力 浏览 74

赵露思与好友出游被偶遇 笑靥如花心情好

扒虾侃娱 浏览 141

全程换电到珠峰 蔚来G318川藏换电路线正式贯通

太平洋汽车 浏览 95

申京:我跟杰伦-格林说过 希望交易能让他更有动力 他会更成熟的

直播吧 浏览 68
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12