关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者12人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI冰火两重天,一边是巨头招揽年薪上亿,一边是冷酷裁员哀鸿遍野

刺猬公社 浏览 11

当年AI的背景男也曾效力火箭 卢指导下赛季率快船夺冠?

仰卧撑FTUer 浏览 16

津门虎扳平比分!基莱斯已入14球,魏震遭炮轰:铲球成就丝滑过人

奥拜尔 浏览 17

何小鹏剧透未来两年新车计划!10到200万都有,回应力劝雷军造车

车东西 浏览 15

「茅台魔咒」,会重现吗?

简七理财 浏览 18

男子当街用铁锤砸死女子 家属:妈妈头骨上有7个坑

扬子晚报 浏览 15

马卡: 姆巴佩在皇马达成50球里程碑,本赛季点球命中率显著提升

直播吧 浏览 22

中国“最牛”小镇:人口4万,面积仅40km²,一年狂赚300亿

正和岛 浏览 12

“股王”腾讯点燃看多热情,如何拥抱“高纯度”港股通科技组合?

侃见财经 浏览 16

媒体:对用AI做“毁损图”申请退款,打击要更精准

澎湃新闻 浏览 15

再见巩俐黄和祥婚礼合影,对比和张艺谋合影,爱与被爱一目了然

温柔娱公子 浏览 23

视频:阅兵训练现场女民兵真飒

中国军号 浏览 9

谷歌宣布签约NBA巨星斯蒂芬·库里,合作推进Pixel、健康与AI产品

IT之家 浏览 11

美媒挑事:巴基斯坦与中国很铁 你细品

澎湃新闻 浏览 19

时速超25公里自动断电,电动自行车新国标9月1日实施!探访:有门店库存最高涨价500元,新国标车暂未到货

红星新闻 浏览 11

订单狂飙500%,工业富联,脱胎换骨!

飞鲸投研 浏览 18

福特总部70年来首次搬家

MOTO 浏览 13

亚之杰李军举报歌手陈红,控诉数十亿资产遭违法掠夺!

市值Observation 浏览 13

两人在上海一家日料店消费4302元:以为是自助餐

极目新闻 浏览 14

零跑全新D系列SUV谍照曝光:尺寸超蔚来ES6,乐道L90迎来劲敌

车评网 浏览 19

夏季穿衣别纠结,这些穿搭能带给你灵感,显瘦清凉又有回头率

静儿时尚达人 浏览 19
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12
0.508425s