关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro16人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

在生活的沟壑里,为自己镶嵌星光

LinkFashion 浏览 48

普通人穿衣别太老气横秋!这些穿搭给你灵感,保暖耐看两不误

静儿时尚达人 浏览 8

ESPN:加拉塔萨雷对京多安感兴趣,球员想去土超感受一下

懂球帝 浏览 80

徐徐清风至,扇底藏春秋

时尚COSMO 浏览 74

中国又一个伙伴倒向美国 撕毁合同把矛头对准中方

博览历史 浏览 23

人工智能时代如何深化跨区域知识产权保护协作,嘉定这场论坛进行了探讨

上观新闻 浏览 62

国庆出游,就要这么“出彩”!

Yuki女人故事 浏览 62

“千亿券商”拿到批文!西部证券38亿并购国融证券

密探财经 浏览 84

全系标配激光雷达 东风奕派eπ007+预售14.99万起

网易汽车 浏览 36

内地第一美人,也塌房了

独立鱼 浏览 23

与孙继海翻脸!董路:我的对手们甘愿被当枪使,自降身价智商全无

念洲 浏览 22

外卖小哥蹊跷失踪22天:凌晨独自到水库 现场找到电动车

极目新闻 浏览 76

托辛:很荣幸在队内是资深球员;“叔叔”的外号来自马杜埃凯

懂球帝 浏览 58

权志龙风波升级!装不懂中文还无视中粉遭暴力对待,挚友被扒辱华

萌神木木 浏览 37

《余生有涯》张彬彬身材引关注,体型差异成焦点

麦芽是个小趴菜 浏览 1365

AI聊天机器人诱导线下约会,一位老人死在寻找爱情的路上

第一财经资讯 浏览 76

美媒:华纳兄弟正在筹备一部科比传记电影《在第8顺位被选中》

直播吧 浏览 75

伊尔迪兹晒照记录参加金球典礼:能出席颁奖典礼是一种荣耀

懂球帝 浏览 84

花400元“过家家”,Jellycat火爆看不懂?情绪消费正带来行业新逻辑

红星资本局 浏览 59

票房从13.65亿跌到1730万,我五味杂陈:这块金字招牌算是砸了

靠谱电影君 浏览 1000

英超头号争议诞生!82分钟被判点球 球员看懵了 英媒:丑闻

叶青足球世界 浏览 71
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12