关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者62人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高圆圆、朱珠美上热搜的蓝色穿搭,太适合夏天了!

LinkFashion 浏览 77

海来阿木凭《嘉禾望岗》爆火 新歌播放量10亿

科学发掘 浏览 17

新一代装甲装备100坦克、100支援战车亮相

新华网 浏览 76

R.I.P.,24岁塔希提国脚卡斯帕德因摩托车事故离世

懂球帝 浏览 87

这就叫专业!“延超”引入VAR视频回放技术

直播吧 浏览 90

黄志忠:离婚后常想儿子 53岁仍旧单身

七公子娱乐 浏览 80

曝涉案俱乐部罚分不降级 国安名宿上禁足名单 苏宁名将或就此退役

我爱英超 浏览 18

8个字引爆国产芯片!UE8M0 FP8到底是个啥?

华尔街见闻官方 浏览 84

国防部:中国不参与任何形式的军备竞赛

环球网资讯 浏览 76

王嘉尔东京开唱,日本名流圈组团来“团建”?

情感大头说说 浏览 1006

湖人旧将!Scotto:活塞与后卫昆西-奥利瓦里达成签约协议

直播吧 浏览 72

扎心…ESPN:13年至今曼联7.6亿签14前锋英超191球,萨拉赫187球

直播吧 浏览 69

今冬高质感穿搭,很有气质!

Yuki女人故事 浏览 56

2026短剧出海:淘汰赛加速,谁主沉浮?

霞光社 浏览 32

迅雷起诉前CEO陈磊:指控其隐秘掏空公司,追索资产2亿元;知名游戏公司发布反腐公告:3名员工涉嫌收受贿赂,已被拘留;京东成立文旅公司

雷峰网 浏览 15

倍耐力官方:下赛季取消C6;所有车队将在12月9日测试新胎

懂球帝 浏览 26

将提升极端场景识别度 小米汽车召回超11万台SU7标准版

网易汽车 浏览 74

全智贤新剧跌破平台下线,迪士尼2亿投资亏本,业内直言堪称灾难

萌神木木 浏览 68

聚焦AI+畜牧,刘松柏攻破鸡味密码,打造终身学习广东样本

南方都市报 浏览 9

内外焕新/新中式设计 全新博越造型曝光 8月正式上市

网易汽车 浏览 65

3人公司9周内赚100万美元的极致创业

虎嗅APP 浏览 97
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12