关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者19人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

胡塞武装称对以色列发动三次“特殊军事行动”

央视新闻客户端 浏览 81

韩残疾人福利院院长性虐待19名女性 受害者称其"爸爸"

扬子晚报 浏览 16

“一言不发”的唐嫣,给娱乐圈上了一课

李橑在北漂 浏览 33

女人“会穿衣”才更美,看看这些穿搭就知道,穿对了真显气质

静儿时尚达人 浏览 10

个体户雇人偷排工业废液致4死 2名主犯死刑复核未通过

封面新闻 浏览 28

今年集中上市 旅行车的春天可能真要来了

网易汽车 浏览 18

佩莱格里尼:很高兴回到主场取胜,转会?贝蒂斯专注于下一场比赛

直播吧 浏览 71

2025款岚图FREE+新车商品性评价

车质网 浏览 38

配华为乾崑ADS,岚图追光L官图发布

大象新闻 浏览 83

欧洲多国向格陵兰岛派遣军事人员 白宫回应

大象新闻 浏览 17

媒体:泽连斯基称不需中国提供安全保障 言论不太友好

新民晚报 浏览 75

陈晓新剧黯然收官!口碑崩塌评论区沦陷?

萌神木木 浏览 31

《生万物》首播!杨幂开磨皮滤镜和秦海璐对比明显,气质格格不入

萌神木木 浏览 76

今年秋天,有这几件单品就够了

黎贝卡的异想世界 浏览 57

拉波尔塔:姆巴佩的做法确实让我感到意外,无论输赢都要大度

懂球帝 浏览 21

特朗普提议俄乌"在当前战线停火" 克宫表态

环球网 浏览 43

中超-申花客场0-0浙江3轮不胜 丢榜首落后海港1分

网易体育 浏览 64

从消费升级到产业跃迁 羊乳市场生态加速重构

中国商报 浏览 77

每体:沙特团队造访巴萨,并邀请巴萨体育部门负责人尤斯特

懂球帝 浏览 70

科瓦奇谈客战拜仁:在安联球场一味退守通常不能得到好结果

懂球帝 浏览 66

男子涉刑案被撤销后申请国赔 派出所所长个人转2.3万

澎湃新闻 浏览 99
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12