关闭广告

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者53人阅读


这项由MWS AI公司和ITMO大学联合完成的研究发表于2025年10月,论文编号为arXiv:2509.22075v2。研究团队包括来自MWS AI的Dmitriy Shopkhoev、Denis Makhov、Magauiya Zhussip和Stamatios Lefkimmiatis,以及来自ITMO大学的Ammar Ali。有兴趣深入了解的读者可以通过该论文编号查询完整研究报告。

现在的大型语言模型就像一台超级智能的机器,能够回答各种问题、写文章、翻译语言,但有一个大问题:它们实在太"胖"了。这些模型需要占用大量的计算机内存和处理能力,就像一辆装满行李的重型卡车,虽然功能强大,但开起来费油又缓慢。对于想在手机、平板电脑或者小型服务器上运行这些智能助手的人来说,这简直是个噩梦。

为了解决这个问题,研究人员们想出了各种"减肥"方法。最流行的一种方法叫做"低秩分解",可以把它理解为把一个复杂的大拼图拆解成几个简单的小拼图。但是这种方法有个致命缺陷:它假设所有的拼图碎片都必须遵循同一个模式,就像强制要求所有人都穿同一个尺码的衣服一样,结果往往是不合身的。

MWS A

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

坦克300Hi-T宁德时代版上市 售24.98万

车质网 浏览 25

郭士强:我们代表中国来展示中国篮球精神 我们在努力重新崛起

直播吧 浏览 68

应对以伊冲突 特朗普提前退席七国集团峰会

新华社 浏览 85

太子集团创始人陈志被遣送回国 外交部回应

财联社 浏览 19

马英九祝贺郑丽文当选:坚守"九二共识" 促进两岸关系

参考消息 浏览 46

高瓴二季度继续重仓中概股:增持拼多多、富途,新进微牛证券

澎湃新闻 浏览 102

珠海收获2金!广东省无人机应用技术职业技能大赛结果揭晓

南方都市报 浏览 22

高市早苗再有新动作日本准备拥有核武 中俄要早做准备

头条爆料007 浏览 22

太狠了!奥特曼亲手「干掉」GPT-5.2,OpenAI祭出最强编程AI

新智元 浏览 19

实拍手机神级修复现场,坏成这样也能修?

爱范儿 浏览 72

维尼修斯索要3000万年薪!皇马拒绝:只给2000万 续约停滞

叶青足球世界 浏览 58

北美夺冠,中国票房从7.8亿跌到6400万,这块金字招牌算砸了?

靠谱电影君 浏览 161

莫斯科底牌打出来了,15个师进入边境

浏览 315

当你沉睡时,TA还在工作

学申论的谈妹 浏览 73

拉波尔塔:这场胜利来得正是时候;亚马尔一如既往地出色

懂球帝 浏览 23

全家花96万坐熊猫专列 吃的是五菜一汤的盒饭

大风新闻 浏览 82

曼晚:回曼市的路上卡里克一直在看回放,今天他们看U21比赛

懂球帝 浏览 15

弗兰克:球队的进攻还需要提升;希望在所有赛事都具有竞争力

懂球帝 浏览 55

《日掛中天》首波真实口碑出炉!观众的打分和评价都“一针见血”

娱乐圈笔娱君 浏览 1092

上海楼市放大招:限购政策调整,激发市场活力

21世纪经济报道 浏览 92

特朗普没想到50%关税打不服印度 还亲手为中国送大礼

空天力量 浏览 83
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12