关闭广告

清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

机器之心Pro1人阅读

在具身智能领域，视觉 - 语言 - 动作（VLA）大模型正展现出巨大潜力，但仍面临一个关键挑战：当前主流的有监督微调（SFT）训练方式，往往让模型在遇到新环境或任务时容易出错，难以真正做到类人般的泛化。但在大语言模型（LLM/VLM）领域，强化学习（RL）已被证明能显著提升模型的泛化能力。RL 究竟能为 VLA 带来哪些独特的泛化优势？与 SFT 相比，它们的优劣势分别体现在哪里？

来自清华大学的研究团队在 NeurIPS 2025 发表文章，首次系统性地揭示了强化学习（RL）在提升 VLA 泛化能力上的独特优势，并带来了一套全面的评测基准和高效训练方法。通讯作者是清华大学教授汪玉和博士后于超。

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

特朗普：以色列与哈马斯签署＂20点计划＂第一阶段协议

央视新闻客户端浏览 5

知情人曝李昀锐孟子义真谈了！狗仔疑似发文内涵，太多细节藏不住

萌神木木浏览 4

拜码头这一块！NBA球星中国行是不是都得来和姚明打个招呼？

直播吧浏览 17

热搜上消失的女明星，正在偷偷养鸡

Yuki女人故事浏览 2

OpenAI前总监最新观点：强化学习在AI领域很强，但不是终极答案

爆角追踪浏览 68

泽连斯基会晤北约秘书长要求提供真正有效安全保障

新京报浏览 12

每体：沙特团队造访巴萨，并邀请巴萨体育部门负责人尤斯特

懂球帝浏览 13

比亚迪欧洲特别顾问阿尔塔维拉：我们必须在欧洲生产汽车电池

IT之家浏览 22

罗马诺：罗梅罗已同意与热刺续约，他6月份就已决定留队

懂球帝浏览 10

伊核设施是否被毁美政府与媒体又吵起来

国际在线浏览 6

新规首次在英超触发！伯恩利门将手持球超过8秒，送给热刺角球

直播吧浏览 10

菲利克斯处子球失而复得！C罗瞬间狂喜，招呼全队疯狂庆祝

奥拜尔浏览 15

半导体再掀涨停潮！“上行周期”成多家公募共识

券商中国浏览 16

特朗普政府据称考虑制裁欧盟官员，欧元下挫1%

华尔街见闻官方浏览 10

王楚钦终于清白了！澄清恋爱谣言

詹妹侃体育浏览 14

点开查看AI明星们街头大吵架议程｜ACC主舞台明天见！

硅星人浏览 17

英国通胀率跃升至3%，还能降息吗？

国际金融报浏览 3518

外套里面穿什么？这4款内搭时髦又显瘦！

Yuki女人故事浏览 12

克宫回应特朗普“最后通牒”：俄方需要时间分析

环球网资讯浏览 20

王凯近况曝光：青筋凸起双腿瘦弱

清游说娱浏览 12

智己汽车将推更多增程式车型，LS6预售20.99万元起

贝壳财经浏览 19

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
沪ICP备20017958号-12

基本文件流程错误 SQL 调试

/www/wwwroot/youyouzixun/public/index.php ( 0.75 KB )
/www/wwwroot/youyouzixun/thinkphp/start.php ( 0.74 KB )
/www/wwwroot/youyouzixun/thinkphp/base.php ( 2.66 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Loader.php ( 21.73 KB )
/www/wwwroot/youyouzixun/vendor/composer/autoload_static.php ( 3.04 KB )
/www/wwwroot/youyouzixun/vendor/topthink/think-helper/src/helper.php ( 2.88 KB )
/www/wwwroot/youyouzixun/vendor/topthink/think-captcha/src/helper.php ( 1.59 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Route.php ( 61.83 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Config.php ( 6.58 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Validate.php ( 42.96 KB )
/www/wwwroot/youyouzixun/vendor/topthink/think-migration/src/config.php ( 0.83 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Console.php ( 23.98 KB )
/www/wwwroot/youyouzixun/vendor/topthink/think-queue/src/common.php ( 1.19 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Error.php ( 3.88 KB )
/www/wwwroot/youyouzixun/thinkphp/convention.php ( 10.66 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/App.php ( 22.17 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Request.php ( 51.50 KB )
/www/wwwroot/youyouzixun/application/config.php ( 9.39 KB )
/www/wwwroot/youyouzixun/application/database.php ( 1.96 KB )
/www/wwwroot/youyouzixun/application/extra/queue.php ( 0.62 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Hook.php ( 4.86 KB )
/www/wwwroot/youyouzixun/application/tags.php ( 0.96 KB )
/www/wwwroot/youyouzixun/application/common.php ( 0.60 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Env.php ( 1.25 KB )
/www/wwwroot/youyouzixun/thinkphp/helper.php ( 17.87 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Lang.php ( 7.49 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Log.php ( 6.28 KB )
/www/wwwroot/youyouzixun/thinkphp/lang/zh-cn.php ( 11.94 KB )
/www/wwwroot/youyouzixun/application/route.php ( 1.03 KB )
/www/wwwroot/youyouzixun/application/index/config.php ( 1.34 KB )
/www/wwwroot/youyouzixun/application/index/controller/Index.php ( 19.89 KB )
/www/wwwroot/youyouzixun/application/index/controller/HomeBase.php ( 4.33 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Controller.php ( 6.29 KB )
/www/wwwroot/youyouzixun/thinkphp/library/traits/controller/Jump.php ( 5.06 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/View.php ( 7.01 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/view/driver/Think.php ( 5.80 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Template.php ( 46.02 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/template/driver/File.php ( 2.31 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Db.php ( 6.85 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/db/connector/Mysql.php ( 4.02 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/db/Connection.php ( 31.00 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/db/Query.php ( 96.72 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/db/builder/Mysql.php ( 4.66 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/db/Builder.php ( 32.43 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Debug.php ( 7.37 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Session.php ( 11.22 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Cache.php ( 6.34 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/cache/driver/Redis.php ( 5.56 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/cache/Driver.php ( 6.21 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/db/Expression.php ( 1.16 KB )
/www/wwwroot/youyouzixun/runtime/temp/75325d359b07109859b583d578ab45f9.php ( 27.95 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/Response.php ( 8.61 KB )
/www/wwwroot/youyouzixun/thinkphp/library/think/debug/Html.php ( 4.28 KB )

[ DB ] CONNECT:[ UseTime:0.000296s ] mysql:host=127.0.0.1;port=3306;dbname=youyouzixun;charset=utf8mb4
[ SQL ] SHOW COLUMNS FROM `xg_jump_url` [ RunTime:0.000283s ]
[ SQL ] SELECT `id`,`my_url`,`jump_type`,`third_url` FROM `xg_jump_url` WHERE `my_url` = 'http://rzqw.cn/new_detail/bc1?c=10&new_id=23908&w=1' LIMIT 1 [ RunTime:0.000143s ]
[ SQL ] SHOW COLUMNS FROM `xg_qdtg` [ RunTime:0.000259s ]
[ SQL ] SELECT `tg_gg_type`,`tg_zhuru` FROM `xg_qdtg` WHERE `tg_id` = 1 LIMIT 1 [ RunTime:0.000132s ]
[ SQL ] SHOW COLUMNS FROM `xg_class` [ RunTime:0.000191s ]
[ SQL ] SELECT `class_name`,`class_id` FROM `xg_class` WHERE `class_statu` = 1 AND `pid` = 1 ORDER BY `class_sort` DESC,`class_id` DESC [ RunTime:0.000148s ]
[ SQL ] SHOW COLUMNS FROM `xg_news` [ RunTime:0.000223s ]
[ SQL ] SELECT `new_title`,`cover_type`,`origin`,`cover_urls`,`new_url`,`count_view`,`add_time`,`new_content`,`seo_key`,`seo_desc` FROM `xg_news` WHERE `new_id` = 23908 AND `new_status` = 1 LIMIT 1 [ RunTime:0.000802s ]
[ SQL ] UPDATE `xg_news` SET `count_view`=`count_view`+1 WHERE `new_id` = 23908 [ RunTime:0.002990s ]
[ SQL ] SHOW COLUMNS FROM `xg_qdtgjs` [ RunTime:0.000282s ]
[ SQL ] SELECT * FROM `xg_qdtgjs` WHERE `tg_id` = 1 AND `js_status` = 1 AND `js_code` IN ('4','5','6','7','8','9','10','11','12','13') [ RunTime:0.000232s ]
[ SQL ] SHOW COLUMNS FROM `xg_new_class` [ RunTime:0.000257s ]
[ SQL ] SELECT `nc`.`nc_id`,`nc`.`class_id`,`nc`.`new_id`,`nc`.`is_top`,`n`.`new_title`,`n`.`origin`,`n`.`cover_type`,`n`.`cover_urls`,`n`.`new_url`,`n`.`count_view`,`n`.`add_time` FROM `xg_new_class` `nc` RIGHT JOIN `xg_news` `n` ON `nc`.`new_id`=`n`.`new_id` WHERE `nc`.`nc_status` = 1 AND `n`.`new_status` = 1 ORDER BY RAND() LIMIT 6 [ RunTime:0.020771s ]
[ SQL ] SELECT `nc`.`nc_id`,`nc`.`class_id`,`nc`.`new_id`,`nc`.`is_top`,`n`.`new_title`,`n`.`origin`,`n`.`cover_type`,`n`.`cover_urls`,`n`.`new_url`,`n`.`count_view`,`n`.`add_time` FROM `xg_new_class` `nc` RIGHT JOIN `xg_news` `n` ON `nc`.`new_id`=`n`.`new_id` WHERE `nc`.`nc_status` = 1 AND `n`.`new_status` = 1 ORDER BY RAND() LIMIT 3 [ RunTime:0.023663s ]
[ SQL ] SELECT `nc`.`nc_id`,`nc`.`class_id`,`nc`.`new_id`,`nc`.`is_top`,`n`.`new_title`,`n`.`origin`,`n`.`cover_type`,`n`.`cover_urls`,`n`.`new_url`,`n`.`count_view`,`n`.`add_time` FROM `xg_new_class` `nc` RIGHT JOIN `xg_news` `n` ON `nc`.`new_id`=`n`.`new_id` WHERE `nc`.`nc_status` = 1 AND `n`.`new_status` = 1 ORDER BY RAND() LIMIT 21 [ RunTime:0.019561s ]
[ SQL ] SELECT * FROM `xg_qdtgjs` WHERE `js_code` IN ('8') AND `tg_id` = 1 AND `js_status` = 1 [ RunTime:0.000252s ]

0.073221s

清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

霍思燕代孕风...

国产晶圆代工...

盘中重大消息...

OpenAI...

杜普兰蒂斯6...

男子花220...

50+女人怎么反油腻？一是裙过膝，二是鞋带跟，美得真实不做作

岚图汽车CEO卢放：岚图上市展现东风汽车转型决心，未来所有车型都会搭载华为技术

32岁昆凌疑似怀孕，肚子隆起孕相明显，曾透露想拼生第四胎

特朗普：以色列与哈马斯签署＂20点计划＂第一阶段协议

知情人曝李昀锐孟子义真谈了！狗仔疑似发文内涵，太多细节藏不住

拜码头这一块！NBA球星中国行是不是都得来和姚明打个招呼？

热搜上消失的女明星，正在偷偷养鸡

OpenAI前总监最新观点：强化学习在AI领域很强，但不是终极答案

泽连斯基会晤北约秘书长要求提供真正有效安全保障

每体：沙特团队造访巴萨，并邀请巴萨体育部门负责人尤斯特

比亚迪欧洲特别顾问阿尔塔维拉：我们必须在欧洲生产汽车电池

罗马诺：罗梅罗已同意与热刺续约，他6月份就已决定留队

伊核设施是否被毁美政府与媒体又吵起来

新规首次在英超触发！伯恩利门将手持球超过8秒，送给热刺角球

菲利克斯处子球失而复得！C罗瞬间狂喜，招呼全队疯狂庆祝

半导体再掀涨停潮！“上行周期”成多家公募共识

特朗普政府据称考虑制裁欧盟官员，欧元下挫1%

王楚钦终于清白了！澄清恋爱谣言

点开查看AI明星们街头大吵架议程｜ACC主舞台明天见！

英国通胀率跃升至3%，还能降息吗？

外套里面穿什么？这4款内搭时髦又显瘦！

克宫回应特朗普“最后通牒”：俄方需要时间分析

王凯近况曝光：青筋凸起双腿瘦弱

智己汽车将推更多增程式车型，LS6预售20.99万元起

清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

霍思燕代孕风...

国产晶圆代工...

盘中重大消息...

OpenAI...

杜普兰蒂斯6...

男子花220...

50+女人怎么反油腻？一是裙过膝，二是鞋带跟，美得真实不做作

岚图汽车CEO卢放：岚图上市展现东风汽车转型决心，未来所有车型都会搭载华为技术

32岁昆凌疑似怀孕，肚子隆起孕相明显，曾透露想拼生第四胎

特朗普：以色列与哈马斯签署＂20点计划＂第一阶段协议

知情人曝李昀锐孟子义真谈了！狗仔疑似发文内涵，太多细节藏不住

拜码头这一块！NBA球星中国行 是不是都得来和姚明打个招呼？

热搜上消失的女明星，正在偷偷养鸡

OpenAI前总监最新观点：强化学习在AI领域很强，但不是终极答案

泽连斯基会晤北约秘书长 要求提供真正有效安全保障

每体：沙特团队造访巴萨，并邀请巴萨体育部门负责人尤斯特

比亚迪欧洲特别顾问阿尔塔维拉：我们必须在欧洲生产汽车电池

罗马诺：罗梅罗已同意与热刺续约，他6月份就已决定留队

伊核设施是否被毁 美政府与媒体又吵起来

新规首次在英超触发！伯恩利门将手持球超过8秒，送给热刺角球

菲利克斯处子球失而复得！C罗瞬间狂喜，招呼全队疯狂庆祝

半导体再掀涨停潮！“上行周期”成多家公募共识

特朗普政府据称考虑制裁欧盟官员，欧元下挫1%

王楚钦终于清白了！澄清恋爱谣言

点开查看AI明星们街头大吵架议程｜ACC主舞台明天见！

英国通胀率跃升至3%，还能降息吗？​

外套里面穿什么？这4款内搭时髦又显瘦！

克宫回应特朗普“最后通牒”：俄方需要时间分析

王凯近况曝光：青筋凸起双腿瘦弱

智己汽车将推更多增程式车型，LS6预售20.99万元起

拜码头这一块！NBA球星中国行是不是都得来和姚明打个招呼？

泽连斯基会晤北约秘书长要求提供真正有效安全保障

伊核设施是否被毁美政府与媒体又吵起来

英国通胀率跃升至3%，还能降息吗？