关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者18人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

如何在全球高端设备领域掌握话语权?“深圳智造”又传喜报

南方都市报 浏览 42

AI抢产能、车厂抢内存,这场博弈中国车企如何破局?

百姓评车 浏览 14

马斯克预言SpaceX明年收入将超NASA全部预算

IT之家 浏览 79

“撒钱”撒出千亿市值公司,影石创新再次狂飙,已有7家公募抢筹

YOUNG财经 浏览 82

特朗普政府酝酿关税B计划

北京商报 浏览 21

就业网站Indeed数据:美国10月职位空缺跌至2021年2月以来最低

华尔街见闻官方 浏览 24

爆破试验带你看巡飞弹飞龙-60A有多强

环球网资讯 浏览 72

“嫁入豪门”沈梦辰:住2亿别墅请4个保姆

小蹒聊娱乐 浏览 82

Deepseek真的让江苏很焦虑?

中访网 浏览 3359

科瓦奇谈客战拜仁:在安联球场一味退守通常不能得到好结果

懂球帝 浏览 66

为何姜文的作品,同样的配方结局却天差地别?

温酒听风 浏览 103

奔驰2026年大动作: 推15款新车 AI智舱/智驾将覆盖全系产品

网易汽车 浏览 17

中国观众认定的烂片,北美观众当成宝,全球破6.9亿夺票房冠军

靠谱电影君 浏览 92

里沙利松:踢日本要展现出与踢韩国一样的强度

懂球帝 浏览 61

紫牛头条|小伙用激光把南京夫子庙扫描做成3D游戏 1:1还原精度到厘米,网友:可以赛博旅游了

扬子晚报 浏览 64

上映27天被观众赶出院线!网播也救不了它,事实证明烂片已无市场

娱乐圈笔娱君 浏览 16

中国女子登顶乔戈里峰后遇难 曾在珠峰顶倒立20秒成名

封面新闻 浏览 82

懒懒陪王思聪低调过38岁生日,晒甜蜜日常

丁丁鲤史纪 浏览 21

即时零售血洗传统零售业!良品铺子首当其冲,下一个是谁?

诗与星空 浏览 12146

泰国军方称已出动F-16战机 摧毁柬方两处军事设施

央视新闻客户端 浏览 71

华为黑科技!传祺M8乾崑版申报图流出 MPV要变天?

网易汽车 浏览 281
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12