关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家71人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北约秘书长斩钉截铁:欧洲永远离不开美国

扬子晚报 浏览 17

王传福紧急刹车!比亚迪转向新战场

象视汽车 浏览 77

神预测,热乎乎的最新诺奖得主电影神作来了

幕味儿 浏览 80

集体异动拉升!603626,四连板!iPhone17,突传大消息!

证券时报e公司 浏览 75

铜墙铁壁,罗马前五轮意甲仅丢一球,为队史第4次做到

直播吧 浏览 67

借小贝之力,三狮欲赴迈阿密集训

体坛周报 浏览 59

抢占日本本土K-car市场 比亚迪Racco亮相

网易汽车 浏览 38

曝沙特明夏仍要签B费!四顾茅庐比刘备还有诚意,曼联愿成人之美

罗米的曼联博客 浏览 66

本田纯电版“冠道”一口价19.99万,轴距近3米,双电机续航650Km

小史谈车 浏览 92

乌镇偶遇谭松韵张子枫,个子都1米5左右

手工制作阿歼 浏览 93

英法空袭叙利亚中部地区 宣称打击极端组织"伊斯兰国"

环球网资讯 浏览 20

稳步迭代,全面超越:vivo S50 Pro mini 评测:小直屏旗舰的进化标杆

快科技 浏览 21

拿到巨额援助的泽连斯基 只用一句话就同时得罪中美俄

空天力量 浏览 3316

价格落在30万级/四季度上市 方程豹钛7正式下线

网易汽车 浏览 79

中国家庭,还缺一辆旅行车

虎嗅APP 浏览 77

扎堆递表 智驾企业的进与困

北京商报 浏览 18

小插曲,威尔士对比利时的世预赛中有老鼠入场短暂干扰了比赛

懂球帝 浏览 60

连刷6集,这部新剧太刺激了

来看美剧 浏览 20

《生万物》老戏骨撑起全场,演技一个比一个炸裂!

电和影 浏览 64

“房东税”要来了?专家解读

网易财经 浏览 80

森林狼询价莫兰特但控卫位置还有高人 哈登辅佐华子?

仰卧撑FTUer 浏览 24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12