关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者32人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普称已考虑接替穆杰塔巴的人选 外交部表态

潇湘晨报 浏览 6

19.88万买原厂合规越野车 212 T01长风柴油版上市

网易汽车 浏览 20

54岁闫妮和27岁女儿同框,母女性格相似如姐妹

小咪侃娱圈 浏览 963

中邮基金换帅!权益规模下降,中邮核心成长混合为何业绩垫底?

Daily每日财报 浏览 20

飞行员举报情人诈骗700余万 被告人获刑12年

红星新闻 浏览 31

欧拉全新SUV亮相,或叫“欧拉5”?

电动邦 浏览 85

这个APEC城市的金融巨无霸,正撕下“老登”标签

博闻财经 浏览 37

今年春天最流行的4件卫衣,照着穿就很好看

LinkFashion 浏览 7

天猫被曝入局共享充电赛道,测试两轮车/汽车充电业务“喵充电”

IT之家 浏览 78

美记者称特朗普可能流放泽连斯基 媒体:能流放到哪去

新民周刊 浏览 85

15万也能开出头等舱质感,试驾锐胜M8

只懂车 浏览 20

2025,当爱猫成 “罪”:家庭传统观念下的女性困境

Yuki女人故事 浏览 308

塔图姆:伯德是凯尔特人队史最佳 他是值得追逐的伟大球员

直播吧 浏览 289

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro 浏览 14

惨不忍睹,四川全场46分创CBA常规赛单场历史最低分

懂球帝 浏览 20

李湘为女铺路太过,带16岁王诗龄,硬往何超琼霍启刚等大佬圈层挤

不八卦会死星人 浏览 18

全球最大稳定币遭质疑 标普将评级降至“最差一档”

财联社 浏览 19

Utopai联手LG、中东主权基金加码韩娱,新模型颠覆AI视频格局!

机器之心Pro 浏览 18

小区保安与居委会副主任及其妹妹冲突后 因脑出血住院

红星新闻 浏览 83

富勒姆球员巴锡边踢比赛边掉裤子,社媒回应:这场我肯定提好裤子

直播吧 浏览 85

东体:乃比江伤情并不乐观,对阵海港将是国安的救赎之战

直播吧 浏览 70
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12