优优资讯

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

北向资金三季...

极氪并入吉利...

世体：切尔西...

被劝退孤独症...

法德将就核威...

媒体:欧洲发...

在九三阅兵活动记者会上江利平引用了毛泽东的一段话

小品类也能撬到大生意，谁成为商家的“赚钱搭子”？

百度网盘更新惹争议？记者实测

印度的崩溃，正是中国的清醒剂！

奇瑞压缩供应商账期至47天

不见特斯拉跟风国产？Model YL以六座SUV身份入局

王俊杰更新社媒晒图：谁还想来碰碰这支队伍！打出这一代的血性！

从“走出去”到“走得稳”，韧性供应链成跨境卖家必修课

自皮克福德加盟埃弗顿已在英超8次扑点，同期列所有门将第二

曹颖：巅峰时嫁人生子隐退，如今带货一年超5亿，妥妥人生赢家!

记者：库迪西亚把埃塞基耶尔卖给药厂最高可盈利2000万美元

媒体：史无前例特朗普宣布首个＂国内恐怖组织＂

九三阅兵名单几乎没有西方发达国家领导人媒体分析

北青：国足冒雨进行强度训练；下场大概率主推四后卫阵型

黄子韬辟谣退出朵微！

身材的不足，这些小技巧能弥补！

董事会投票再现分歧！奥浦迈拟14.51亿元并购澎立生物再遭反对，独董陶化安多次质疑并购必要性

净利大增172.72%！这家券商半年报出炉，高管布阵也有新变化

拒15亿,Andrew Tulloch重返Meta,Thinking Machines Lab痛失联创

阿里通义实验室发布UI-S1：让AI掌握手机操作的新突破

辛巴“退出”后，初瑞雪首场直播卖出20亿元，辛选持续“去辛巴化”

美媒公布新赛季小前排名：詹姆斯居首杜兰特第2 小卡第5乔治第18

妙佑医疗国际官方指导，曜影医疗启动长寿门诊，以多学科与数字化平台开创医学级长寿管理

苹果手机返校季优惠开闸，“学生资质”售卖火热，律师提示“代买”风险