关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者83人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2名以方被扣押人员失联 卡桑旅要求以军暂停空袭24小时

极目新闻 浏览 81

意媒:未过体检,马特塔交易告吹

体坛周报 浏览 16

是谁想的给迪丽热巴穿新中式?

时尚COSMO 浏览 88

持续烧钱的大模型,阻挡不了AI行业的热情

蓝鲸新闻 浏览 15

滕帅引援+1!官方:皇马功勋巴斯克斯自由身加盟勒沃库森

直播吧 浏览 81

五旬老人带孩子,红雷叔和乃文叔都疯了。

伊周潮流 浏览 76

女子疑因家暴离世 知情人披露详情:被抓的婆婆是医生

新快报新闻 浏览 66

以色列民众反对进攻加沙 民意与政府撕裂加剧

海外网 浏览 80

美媒分析快船新赛季前景:莱昂纳德的健康情况和发挥决定球队上限

直播吧 浏览 97

有望2026年亮相 曝法拉利首款纯电动车谍照

车质网 浏览 66

英国安德鲁王子放弃王室头衔 被指与未成年人发生关系

CCTV国际时讯 浏览 54

王琳的中年孤独,有钱也填不满

江湖人称艾掌门 浏览 71

张馨予医院打吊水!自曝体重降到100斤体质变差

韩小娱 浏览 20

人均预期寿命提高至80岁,失能老人如何有尊严地活着?两会代表委员建言:服务不能“一刀切”

时代周报 浏览 8

终身免费充电!冰箱彩电大沙发全标配,昊铂新车只卖26.98万

电车通 浏览 73

阿里“干掉”PS了,深夜正式开源

智东西 浏览 90

大众汽车营收微降却亏麻了,利润腰斩暴跌53.5%!

财视传播 浏览 6

无显示屏、靠Siri控场?苹果首款眼镜核心功能全曝光

环球网资讯 浏览 25

洪森晒图驳斥"已飞往中国"传言:没有逃往任何地方

环球网资讯 浏览 83

特朗普机场迎接普京 红毯两侧各停放两架F-22战机

新华社 浏览 100

同曦126-123双加时逆转深圳,郭昊文31+6+10,史密斯空砍44分

懂球帝 浏览 17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12