关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者58人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

理想踢到了钢板 乘龙卡车:严重侵权、误导公众

网易汽车 浏览 66

深夜,阿里大爆发!中概股大涨

证券时报 浏览 69

科学家发现首批 45 亿年前“原始地球”痕迹,揭示太阳系早期秘密

IT之家 浏览 50

何宇鹏:能为国安踢球真幸福;锈迹是暂时的,用汗水磨掉生疏

懂球帝 浏览 67

中年女性高级感穿搭秘诀:裙过膝、鞋带跟、包精致,更大方

静儿时尚达人 浏览 21

"国资委经济发展中心"涉假冒 旗下公司与政府签百亿大单

澎湃新闻 浏览 71

真挚的祝福!中国篮球之队官博祝刘礼嘉21岁生日快乐

直播吧 浏览 61

定位中大型SUV 红旗HS6 PHEV开启盲订

车质网 浏览 41

九三阅兵宣传曲MV上线:受阅一次成就一生荣光

人民日报 浏览 63

新一轮货币宽松到来

泽平宏观展望 浏览 18

中国“智”造闪耀国际舞台,“维度I型”无人机成功出海

红星新闻 浏览 70

媒体:俄乌战场“飞出”的无人机 为何让欧洲如此忧惧

极目新闻 浏览 3095

DeepSeek V3.1发布,成最好非思考编程模型

AI寒武纪 浏览 97

以色列后院起火 伊朗用出人意料的方式打响反击第一枪

空天力量 浏览 2992

“做次反派,人生爽翻”

时尚COSMO 浏览 46

赵露思这段戏火了,陈伟霆当初没说错

刘蕳爱下厨 浏览 98

美国“恢复核试验表态”背后有何考量

环球网资讯 浏览 30

北京大学联合多所知名高校突破机器人视角转换技术

科技行者 浏览 32

200多斤小伙落水漂浮7小时 钱塘江大潮来临之际获救

新民晚报 浏览 63

A股“网红经济第一股”要来港股!还能再爱一次吗?

IPO日报 浏览 18

1万亿订单再加3500-5000亿美元!OpenAI“停不下来”,“当你欠每家数千亿美元,钱的问题自己会解决”?

华尔街见闻官方 浏览 68
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12