关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者16人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

导演赖声川遭观众质问后续:屈中恒被换角,对涉毒艺人零容忍!

萌神木木 浏览 86

英超前六相互交锋积分榜:曼联、维拉积12分最多,阿森纳9分

懂球帝 浏览 16

“双11”本地之战|淘宝便利店剑指美团腹地 电商巨头激战线下“最后一公里”

北京商报 浏览 42

特朗普威胁对尼日利亚动武 中方表态

极目新闻 浏览 27

GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网

新智元 浏览 80

与蒋欣分手2年的王阳,现在过得怎么样?

探长影视解说 浏览 73

科贝:本轮西甲对阿隆索的未来至关重要,若战绩不佳可能下课

懂球帝 浏览 22

今日最难得,我们十一周年啦!

黎贝卡的异想世界 浏览 53

网友称陕西一镇上有狼外逃 当地:系狼犬 已击毙21只

封面新闻 浏览 69

"杭州湾X5"来了 40万级性能插混极氪8X官宣

网易汽车 浏览 16

网约车司机接到订单慌了:男子拿着黑塑料袋要去公墓

极目新闻 浏览 68

航母“弹射三连”释放哪些信号

经济日报 浏览 91

文章恋情曝光后首现身,左手戴戒指疑似二婚,与绯闻女友多次同台

萌神木木 浏览 111

盘中重大消息宣布,阿里巴巴大涨

第一财经资讯 浏览 75

美媒:以色列暗杀胡塞武装高级领导人失败

环球网资讯 浏览 83

吕焯毅:我们踢得很团结有韧劲,大家都满意这场比赛

懂球帝 浏览 50

比亚迪王朝“饭票”曝光,可吃四菜一汤

IT之家 浏览 23

记者:米兰的A-希门尼斯接近租借加盟伯恩茅斯,附有条件强制买断

直播吧 浏览 73

恭喜!卡莱尔与步行者达成多年续约合同:上赛季率队打进总决赛

罗说NBA 浏览 90

"露奶衫"算什么?这6件斩女衬衫才是真时髦显瘦!早春这么穿很美

Yuki女人故事 浏览 315

纯电版路虎揽胜原型车亮相,外观保持不变,年底前发布

皆电 浏览 73
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-12