关闭广告

研究人员打造BiDoRA解决DoRA耦合,以高效微调解锁小数据潜力

DeepTech深科技88人阅读

如今,像 GPT 系列这样的大模型已经展现出了惊人的通用能力,但要让它们在某个具体领域发挥最大效力,还需要进行“微调”(Fine-Tuning)。传统的“完整微调”方法,需要调整模型中全部的数百亿甚至千亿参数,这不仅需要海量的计算资源(比如数十上百块顶级 GPU),训练时间也十分漫长。因此,“参数高效微调”(PEFT,Parameter-Efficient Fine-Tuning)技术应运而生,它旨在只调整模型中极小一部分的参数,就能达到接近甚至超越完整微调的效果。

在 PEFT 家族中,LoRA 是一个里程碑式的工作。而研究团队关注到,业内最近提出的 DoRA(Weight-Decomposed Low-Rank Adaptation)在 LoRA 的基础上更进了一步。DoRA 的核心思想是,它认为模型权重的更新,可以被分解为“大小”(magnitude)和“方向”(direction)两个独立维度的变化。这个洞察非常深刻,因为它更贴近模型在完整微调时的真实动态。通过这种分解,DoRA 确实在很多任务上超越了 LoRA。

然而,在深入研究 DoRA 的过程中,研究团队发现它虽然方向走对了,但仍然存在一些问题。DoRA 在训练时,是同时优化大小和方向这两个部分的,并且用的是同一份训练数据。研究团队认为这种“耦合”的优化方式会带来两个关键问题:第一,它让模型的能力过于强大,很容易“死记硬背”训练数据,导致在面对新数据时表现不佳,也就是人们常说的“过拟合”。第二,大小和方向的同步更新会形成一种内在的牵制,限制了模型寻找最优解的学习能力。

所以,研究团队这次研究的核心目标非常明确:保留 DoRA 关于权重分解的深刻洞察,但

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马卡:塞尔塔公布本赛季5名队长人选及顺位 阿斯帕斯仍是第一队长

直播吧 浏览 78

郑丽文"不谈统一"让人失望了 蔡正元的话一针见血

现代小青青慕慕 浏览 32

百润股份:当白酒巨头杀入低度红海

Daily每日财报 浏览 86

马刺加时134-130爵士取季前赛3连胜,文班22+7,贝利20+7

懂球帝 浏览 76

奇瑞“掀桌子”了!首款固态电池车星途ES8,零下30℃续航1000Km

车矩阵更懂车 浏览 18

孙怡带8岁女儿做美甲,8岁女儿自称烤指甲很疼

小兰聊历史 浏览 60

美媒:美在造船领域严重落后于中国 已向日韩求助

环球时报国际 浏览 85

特朗普在联大讲话1小时"骂"遍世界 "金句"和笑料不断

观察者网 浏览 80

斜肩上衣+半身裙,清凉松弛显气质!

Yuki女人故事 浏览 101

乌克兰袭击莫斯科一座热电站 距克宫仅百余公里

上观新闻 浏览 18

北极航线开通中欧班列恢复 想逼中国低头的波兰扎心了

南权先生 浏览 79

今年夏天一定要拥有的4件衣服,太好看了!

LinkFashion 浏览 82

刚说完战争很快结束 特朗普改口

参考消息 浏览 10

乌克兰问题华盛顿会晤举行,国际油价将如何演绎

第一财经资讯 浏览 71

48家发债主体中报延期 审计梗阻、系统改革、经营挑战

21世纪经济报道 浏览 73

亏损超2亿?《用武之地》票房崩塌,我感慨:这块金字招牌算砸了

靠谱电影君 浏览 27

队报:马赛后卫梅迪纳脚踝受伤,将缺席至9月上旬

直播吧 浏览 72

记者:U21联赛和U19中青赛合并为U20联赛,只是超龄球员数额不同

懂球帝 浏览 18

经纪人:公平地对待库明加 考虑当下就给球员选项 考虑未来就加钱

直播吧 浏览 90

协议中加入"毒丸"条款 美国与印尼的贸易协议面临破裂

第一财经资讯 浏览 25

恩里克:我们在23分钟内丢了3个球?那是对手球员的实力所致

懂球帝 浏览 62
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12