关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技84人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

白金卡旅客途中骚扰空姐 让绯闻满公司飞逼得空姐离职

极目新闻 浏览 82

华为鸿蒙第五界首车正式亮相

电动知家 浏览 141

美媒:美国曾以为贸易战能改变中国经济 但它错了

环球时报国际 浏览 28

拿到泼天订单的YU7,让小米汽车既甜蜜又烦恼

禾颜阅车 浏览 81

手机租赁平台"青云租"疑爆雷 女子9万上车被反套35万

封面新闻 浏览 37

全网劝离大集合,从黄圣依、黄晓明到董璇

爱吃冰棍的小痞子 浏览 91

闪电快讯|海信发布影游旗舰E8S,RGB-Mini LED价格下探

电厂 浏览 19

人形机器人“赛试”观察:被科技的“笨拙”逗笑后,人们看见了真实发生的进步

红星新闻 浏览 75

15亿库存压顶,曾经的“国潮顶流”卖不动了

深蓝财经 浏览 80

泡泡玛特上半年营收超去年全年,labubu所在系列涨幅达668%

红星资本局 浏览 81

鸿蒙智行问界 M8 纯电版汽车前备箱业界首次采用视觉防夹

IT之家 浏览 80

湖人126-114勇士,库詹东缺阵,里夫斯21分伤退,波杰23+5+8

懂球帝 浏览 70

西班牙顶着美欧施压选择华为设备 欧盟又指手画脚

澎湃新闻 浏览 3039

姚晨怒批倍速看剧:观众不该背锅

小白趣味屋 浏览 23

59元钓鱼3小时,年轻人只想静静

中国企业家杂志 浏览 60

离婚后高调秀恩爱的杨子,没给黄圣依留一丝体面

乡野小珥 浏览 88

评论丨网购衣服上的“密码锁”,是商业诚信的刺眼“疤痕”

红星新闻 浏览 34

记者:在不用参与训练时,B费也会在场边观看以给予队友鼓励

懂球帝 浏览 42

分手传闻仅4月 关晓彤的举动证实 鹿晗确实做错了

东方不败然多多 浏览 91

一文解读杨振宁的百年人生密码 曾与爱因斯坦做同事

北京日报客户端 浏览 55

江南分馆新增导演惊喜交流,明日中午开票!

幕味儿 浏览 9
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12