关闭广告

马里兰大学团队让3.5B参数小模型媲美50B大模型的推理能力

科技行者18人阅读


这项由马里兰大学计算机科学系的Jonas Geiping和Tom Goldstein教授领导的研究团队发表于2025年2月的突破性研究,首次展示了一种全新的人工智能思维方式。该研究论文《用潜在推理扩展测试时计算:一种循环深度方法》可通过arXiv:2502.05171v2获取完整内容。研究团队还包括来自图宾根大学、劳伦斯利弗莫尔国家实验室等多个机构的研究人员,他们开发的模型代码已在GitHub开源,训练好的模型也在HuggingFace平台公开可用。

设想一下这样的场景:当你遇到复杂问题时,不是立刻脱口而出答案,而是在心中反复思考、推演,直到想透彻了才开口。研究团队发现,现有的AI模型就像那些总是急于回答的学生,缺乏深度思考的能力。它们通常要么依靠庞大的参数量来"强记硬背",要么需要把思维过程完全用文字表达出来,就像必须把所有想法都写在草稿纸上一样繁琐。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

金秋,穿最浪漫的裤子去散步

Yuki女人故事 浏览 10

董璇自曝高云翔偷偷再婚,她不在意了

观察鉴娱 浏览 13

马上售罄,预购从速!今晚是妥妥的世界首映

幕味儿 浏览 11

阿尔特塔谈哲凯赖什首发:他能给对手带来恐惧感

懂球帝 浏览 10

小红书刷屏,这个谷歌开发者大会上到底有什么?

果壳 浏览 24

小米智能摄像机 4 双摄版上架:一台顶两台,售 299 元

IT之家 浏览 8

英特尔高端 Granite Rapids-WS 规格曝光:最高 86 核心 172 线程

IT之家 浏览 8

妇联回应受胡雷资助女孩去世:村镇妇联一直进行帮扶

极目新闻 浏览 10

李兰迪元气透亮肌的权威,我后知后觉

时尚COSMO 浏览 16

252名记者在加沙遇难 巴勒斯坦记者游行悼念

环球网资讯 浏览 3

父亲辞职带9岁多动症儿子徒步60天:同行还有2组家庭

潇湘晨报 浏览 3

哈马斯:以色列无视停火努力 选择继续战争

参考消息 浏览 21

中国AI企业闯中东:石油资本背后的技术远征

经济观察报 浏览 10

你以为卖得很惨实际活得很好的四款车

汽车天涯 浏览 10

韩团女爱豆和内娱男演员,BE感拉满了

伊周潮流 浏览 11

30多家单位发布《超节点智算应用“北京方案”》

网易科技报道 浏览 6

李雪琴和男友KTV约会,笑得很甜

探源历史 浏览 13

20.99万元起、首搭“恒星”超级增程技术,新一代智己LS6开启预售

北京商报 浏览 21

“即时转化”渐成陷阱:长期增长仍靠品牌价值建设

正和岛 浏览 15

陕西一养殖户饲养的狼犬外逃 未逃的15条狼犬已击毙

极目新闻 浏览 14

女人还是夏天穿“裙子”最好看,试试这些裙装穿搭,优雅大方

静儿时尚达人 浏览 19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12
0.235951s