关闭广告

MIT和斯坦福打造"超级听力"AI:让机器像人耳一样理解声音的奥秘

科技行者85人阅读


这项由MIT脑与认知科学系的Greta Tuckute以及斯坦福大学计算机科学系的Klemen Kotar、Daniel L. K. Yamins等研究者共同完成的突破性研究,发表于2025年8月的arXiv预印本平台。有兴趣深入了解的读者可以通过arXiv:2508.11598v1访问完整论文。

说起人类的听觉系统,那真是一个令人惊叹的生物工程奇迹。我们能够在嘈杂的咖啡厅里轻松分辨出朋友的声音,能够从语调中听出说话人的情绪变化,甚至能够在听到一个陌生单词时大致猜出它的含义。然而,让人工智能系统达到人类这样的听觉理解能力,却是一个让科学家们头疼了很久的难题。

传统的AI语音处理系统就像是一个只会机械记忆的学生,它们要么专注于完美地复制原始音频信号的每一个细节,要么依赖复杂的对比学习机制来区分不同的声音片段。这些方法虽然在某些特定任务上表现不错,但却缺乏人类

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普向60国发出邀请之际 多国正商量怎么对付美国

新民周刊 浏览 19

曝黄子韬徐艺洋将补办婚礼,经纪人公布时间,将于10月中旬举行

扒虾侃娱 浏览 76

波罗的海三国正式退出《渥太华禁雷公约》

上观新闻 浏览 17

建立互信和实现共赢,解读国有车企高层为何密集拜会任正非?

百姓评车 浏览 85

连券商首席都被妈妈“科普”,商业航天太火了

财通社 浏览 19

嘉定企业携新品亮相集成电路设计业展览会

上观新闻 浏览 19

注册球员+1!官方:巴萨门将霍安-加西亚在西甲完成注册

直播吧 浏览 71

智能化升级 新款卡罗拉锐放限时售9.68万起

网易汽车 浏览 36

“十四五”期间全国统一大市场的“四梁八柱”基本建立

上观新闻 浏览 78

优艾智合冲刺港股“移动操作机器人第一股”!旗下产品曾出演《流浪地球2》

红星资本局 浏览 88

地平线苏箐:3年后 准L4级系统大概率已经量产

网易汽车 浏览 25

剧版《西虹市首富》首波口碑出炉了!观众打分评价都“一针见血”

娱乐圈笔娱君 浏览 16

DO:罗梅罗决定留在热刺,并与热刺续约至2029年

懂球帝 浏览 92

胡金秋:在和平年代,能为中国去奋斗是特别荣誉和骄傲的事情

懂球帝 浏览 80

佩通坦含泪谴责柬埔寨向平民区开火:军方已做好准备

新京报 浏览 83

张馨予减肥致体质差,170身高仅百斤两月发烧三次

把喜欢都给他 浏览 15

《一路繁花2》出圈理由

娱乐圈笔娱君 浏览 846

聂卫平告别仪式:兰莉娅变化大

古希腊掌管松饼的神 浏览 27

媒体:哈梅内伊大意了 他在最关键的时刻相信了美国

经济观察报 浏览 10

搭载第五代EA888 新款大众揽境预售29.99万起 8月上市

网易汽车 浏览 86

格陵兰岛称选择丹麦和欧盟 已准备好迎接更大规模军事存在

国际在线 浏览 17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12