关闭广告

谷歌DeepMind让AI大脑学会了超强"语言视觉连接"

科技行者82人阅读


这项由谷歌DeepMind的Michael Tschannen和Xiaohua Zhai领导的突破性研究发表于2025年2月,研究团队开发了名为SigLIP 2的新一代多语言视觉-语言编码器。有兴趣深入了解的读者可以通过arXiv:2502.14786v1访问完整论文。这项研究就像是给AI装上了一双能看懂世界各种语言文字的"超级眼睛",不仅能理解英语图片,还能准确理解中文、日语、阿拉伯语等36种不同语言的图像内容。

回想一下我们人类是如何理解图片的:当你看到一张照片时,你的大脑会瞬间将视觉信息与语言概念连接起来。比如看到一只猫的照片,你会立刻想到"猫"这个词,甚至能用语言描述猫的颜色、姿态和所在环境。而如果你掌握多种语言,你还能用不同语言来描述同一张图片的内容。

现在,研究团队成功让AI也具备了这种跨语言的"看图说话"能力,而且表现得比以往任何系统都要出色

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

置换抢购价9.99万元起 捷途X70L正式上市

网易汽车 浏览 72

TA:利物浦的状态有所回暖;热刺展现了足够的斗志和韧性

懂球帝 浏览 22

很会穿裙子的杨采钰,她这个搭配思路还挺实用

黎贝卡的异想世界 浏览 87

宝马将采取油电并存策略,董事会成员高乐称“内燃机永不会消失”

IT之家 浏览 84

两部门:不得变相强制网络交易平台内经营者承担退款不退货等售后责任

YOUNG财经 浏览 25

有银行今年降了七次!存款利率又双叒下调

21世纪经济报道 浏览 57

从2499到3299:Rokid还要收割几次信任?

蓝鲸新闻 浏览 85

喜茶,沉不住气了

大厂青年 浏览 90

赵伟:财政“下半场”,可能的“后手”?

首席经济学家论坛 浏览 80

中马智库机构在吉隆坡举行交流座谈 探讨区域研究与合作

BT财经 浏览 7

江一燕8年前与赵汉唐因戏结缘 最后同框在今年4月

萌神木木 浏览 1168

央视中秋宋佳大气唐嫣美艳,侯佩岑主持功底深,谢娜受邀另有原因

不八卦会死星人 浏览 438

继与霉霉恋情谣言后,里弗斯被传约会网红

艺兔体坛 浏览 24

剑指AI终端产业,东莞和深圳携手再放大招|东莞一周

南方都市报 浏览 66

马卡:赫伊森在高强度比赛中表现糟糕,他需要提升防守硬度

懂球帝 浏览 27

刘强东太松弛!吃路边摊用塑料碗喝酒

仁慈的视角 浏览 68

乌克兰决定与尼加拉瓜断交

参考消息 浏览 56

自动驾驶将迎来巅峰对决

禾颜阅车 浏览 23

俄乌“和平计划”又生变 欧洲“强有力”回应特朗普批评

环球网资讯 浏览 22

委内瑞拉:启动"前所未有"后勤动员

参考消息 浏览 25

王思聪懒懒晒照破“分手”传言?

深析古今 浏览 78
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12