关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家9人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

携热门AI科技产品矩阵亮相 小鹏汽车登陆成都车展

网易汽车 浏览 16

瞬间暴跌40%,东方甄选到底怎么了?

财经锐眼 浏览 15

高温,是如何改写人类命运的?

时尚COSMO 浏览 56

广东全运男篮热身赛 徐杰&胡明轩&周鹏登上宣传海报

直播吧 浏览 10

轻熟女人看看这些夏季穿搭,从中找到适合的方案,减龄不老气

静儿时尚达人 浏览 19

NBA官网评西部关键补充:KD加入火箭 湖人补强内线 勇士查无此人

直播吧 浏览 14

算错帐,阿尔特塔说近三赛季阿森纳拿分最多,而事实上是曼城

懂球帝 浏览 15

没有你早花了!罗伊斯-奥尼尔半场三分6中4砍15分2断&次节12分!

直播吧 浏览 204

超300倍就清零!超高位科技股突然暴跌,中芯国际重挫7%

深蓝财经 浏览 4

财经调查丨一张红木床差价27000元!央视曝光红木市场销售乱象→

央视财经 浏览 15

硅谷高管消息群一夜未停 H-1B新规让美企慌了白宫找补

红星新闻 浏览 24

约克雷斯社媒:为这家特别的俱乐部完成首秀,这是无比自豪的时刻

直播吧 浏览 10

商人遭警察逼迫签千万调解协议后又被抓 检方赔偿18万

澎湃新闻 浏览 14

内塔尼亚胡:以色列目标不仅在加沙

每日经济新闻 浏览 10

魅族 Flyme 系统 12306 实况通知进入最后的内测完善阶段

IT之家 浏览 15

面对特朗普的掠夺式要价欧盟不得不妥协 媒体披露原因

新民晚报 浏览 10

不是吧,45岁方力申还能当世界冠军?带孕妻见证荣耀,太燃了!

娱乐白名单 浏览 21

特朗普:若与普京谈判顺利 第二次会晤将邀请泽连斯基

国际在线 浏览 24

谍战融合喜剧,张一山分饰两角,《守护者们》开辟谍战剧新赛道

最爱酷影视 浏览 18

维尼修斯索要3000万年薪!皇马拒绝:只给2000万 续约停滞

叶青足球世界 浏览 10

不要怀疑任何一张能进内娱的脸

时尚COSMO 浏览 12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12
0.070955s