优优资讯

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

中期改款奔驰...

合富中国的六...

跨年档、抓总...

央视探访：蔡...

星光730灵...

雷诺亮眼业绩...

皇马TV显示，贝林厄姆将在国家德比中担任首发右边锋

Stellantis，“分”或许比“合”好

“平民卫士”搅局硬派SUV市场 iCAR V27首发登场

白金卡旅客途中骚扰空姐让绯闻满公司飞逼得空姐离职

华为鸿蒙第五界首车正式亮相

美媒：美国曾以为贸易战能改变中国经济但它错了

拿到泼天订单的YU7，让小米汽车既甜蜜又烦恼

手机租赁平台＂青云租＂疑爆雷女子9万上车被反套35万

全网劝离大集合，从黄圣依、黄晓明到董璇

闪电快讯｜海信发布影游旗舰E8S，RGB-Mini LED价格下探

人形机器人“赛试”观察：被科技的“笨拙”逗笑后，人们看见了真实发生的进步

15亿库存压顶，曾经的“国潮顶流”卖不动了

泡泡玛特上半年营收超去年全年，labubu所在系列涨幅达668%

鸿蒙智行问界 M8 纯电版汽车前备箱业界首次采用视觉防夹

湖人126-114勇士，库詹东缺阵，里夫斯21分伤退，波杰23+5+8

西班牙顶着美欧施压选择华为设备欧盟又指手画脚

姚晨怒批倍速看剧：观众不该背锅

59元钓鱼3小时，年轻人只想静静

离婚后高调秀恩爱的杨子，没给黄圣依留一丝体面

评论丨网购衣服上的“密码锁”，是商业诚信的刺眼“疤痕”

记者：在不用参与训练时，B费也会在场边观看以给予队友鼓励

分手传闻仅4月关晓彤的举动证实鹿晗确实做错了

一文解读杨振宁的百年人生密码曾与爱因斯坦做同事

江南分馆新增导演惊喜交流，明日中午开票！