图像缩放攻击突破Google Gemini等AI系统安全防护
创始人
2025-08-24 07:01:07
0

来源:至顶网

Trail of Bits的安全研究人员发现,Google Gemini CLI和其他生产环境中的AI系统可能被图像缩放攻击所欺骗,这是机器学习系统面临的一个众所周知的对抗性挑战。

Google认为这个问题并不构成安全漏洞,因为它依赖于非默认配置才能实现攻击。

图像缩放攻击的概念最初在2019年的USENIX安全会议论文中被讨论,该研究基于此前关于对抗性样本的工作,这些样本能够混淆计算机视觉系统。这种技术涉及将提示信息嵌入到图像中,指示AI违反其准则行事,然后操纵图像来对人眼隐藏提示信息。这需要以特定方式准备图像,使恶意提示编码与模型采用的任何图像缩放算法产生交互。

在一篇博客文章中,Trail of Bits安全研究人员Kikimora Morozova和Suha Sabi Hussain解释了攻击场景:受害者将恶意制作的图像上传到易受攻击的AI服务,底层AI模型根据图像中的隐藏指令执行数据窃取操作。

"通过传递用户不可见的多模态提示注入,我们在包括Google Gemini CLI在内的系统上实现了数据泄露,"Morozova和Hussain写道。"这种攻击之所以有效,是因为AI系统通常在将大图像发送到模型之前会将其缩小:当缩放时,这些图像可能会暴露在全分辨率下不可见的提示注入。"

提示注入发生在生成式AI模型接收到包含可信和不可信内容混合的输入时。这与越狱不同,后者只是旨在绕过安全机制的输入。

提示注入可能是直接的(由用户输入),也可能是间接的(当用户指示模型处理包含模型可以执行的指令的内容时)。后者的一个例子是要求AI模型总结包含恶意指令的网页——模型由于没有区分预期和非预期指令的固有能力,会简单地尝试遵循所有命令。

Morozova和Hussain描述的图像缩放攻击是一种间接提示注入形式,它比许多其他技术有更高的成功几率,因为恶意文本对用户是隐藏的——只有通过缩小图像的过程才会暴露。

为了展示该技术的真实恶意潜力,Morozova和Hussain开发了一个名为Anamorpher的开源工具,可用于制作针对三种常见缩放算法的图像:最近邻插值、双线性插值和双三次插值。

研究人员表示,他们已经成功对以下系统实施了图像缩放攻击:使用Gemini后端的Vertex AI、Gemini的网络界面、通过llm CLI的Gemini API、Android手机上的Google Assistant,以及Genspark智能体浏览器。

Google指出,该攻击仅在Gemini的非标准配置下才有效。

"我们认真对待所有安全报告,并感谢安全社区的研究,"Google发言人告诉The Register。"我们的调查发现,所描述的行为在Gemini CLI的默认安全配置中并不构成漏洞。"

Google发言人解释说,要使攻击成为可能,用户首先需要明确声明他们信任输入,覆盖默认设置,然后摄取恶意文件。

"正如我们项目存储库中记录的那样,我们强烈建议开发者只提供对他们信任的文件和数据的访问权限,并在沙箱内工作,"Google发言人说。"虽然我们为用户提供高级配置选项和安全功能,但我们正在借此机会在工具中为任何选择禁用此保护措施的用户添加更明确的警告。"

Trail of Bits研究人员建议不要在智能体AI系统中使用图像缩放。如果必须使用,他们认为应该始终向用户展示模型实际看到的内容预览,即使是CLI和API工具也应如此。

但实际上,他们表示AI系统需要系统性防御措施来降低提示注入的风险。

Q&A

Q1:什么是图像缩放攻击?它是如何工作的?

A:图像缩放攻击是一种对抗性攻击技术,通过将恶意提示嵌入图像中,然后利用AI系统的图像缩放过程来暴露这些隐藏指令。攻击者制作特殊图像,在全分辨率下恶意文本对人眼不可见,但当AI系统缩放图像时会暴露出来,从而欺骗AI模型执行未授权操作。

Q2:Google Gemini是否存在安全漏洞?

A:Google认为这不是安全漏洞,因为攻击只在非默认配置下才能成功。用户需要明确声明信任输入并覆盖默认安全设置,然后处理恶意文件才可能受到攻击。Google建议开发者只访问可信文件并在沙箱环境中工作。

Q3:如何防范图像缩放攻击?

A:研究人员建议不在智能体AI系统中使用图像缩放,如果必须使用则应向用户显示模型实际看到的内容预览。更重要的是,AI系统需要建立系统性防御措施来降低提示注入风险,包括更严格的输入验证和安全配置。

相关内容

热门资讯

荣耀阿尔法战略深化,端侧AI技... 8月17-21日,国际音频领域顶级会议INTERSPEECH在荷兰鹿特丹举办。荣耀联合上海交通大学完...
苏州创博检测取得内径表专用检测... 金融界2025年8月23日消息,国家知识产权局信息显示,苏州创博检测技术有限公司取得一项名为“一种内...
水果为什么越来越甜了?还能放心... 你有没有发现 水果变得越来越甜了? 清甜可口的西瓜、 香甜多汁的草莓…… 这份甜蜜让人们在大饱口福的...
海南防汛防风应急响应提升至Ⅰ级... 新华社海口8月24日电(记者罗江、夏天)海南省防灾减灾救灾委员会于24日10时将防汛防风Ⅱ级应急响应...
50公里跨市无人机物流航线首飞 50公里跨市无人机物流航线首飞 从汉正街到汉川羽绒服产业园仅用35分钟 湖北日报讯 (记者王欣、通...
中科海洋申请空化射流水下清洗机... 金融界2025年8月23日消息,国家知识产权局信息显示,中科海洋(广西)科技有限公司申请一项名为“一...
华为公司副总裁周跃峰:建设先进... 钛媒体App 8月23日消息,“随着AI的进一步发展,我们需要建设先进数据基础设施,以打破孤岛,融合...
北京大学李焱团队:三维光子集成... 北京大学李焱教授团队综述文章。 封面解读 封面描述了基于飞秒激光直写的三维光子集成芯片的制备过程及...
原创 美... 如果大家关注通信技术,就一定知道中国通信技术发展,真的太强了。 1G的时候,我们完全没研究,2G时才...
原创 中... 在人类逐梦太空的伟大征程中,航天服,无疑是宇航员们最为贴身且至关重要的“生命铠甲”。 然而,当对比中...
”增强人类” vs “机器换人... 8月8日~12日,2025世界机器人大会(WRC)在北京亦庄北人亦创国际会展中心圆满举行,近百万名观...
平高电气等公布“一种断路器与三... 天眼查APP显示,近日,天津平高智能电气有限公司,河南平高电气股份有限公司申请的“一种断路器与三工位...
华菱线缆公布“一种基于电缆表面... 天眼查APP显示,近日,湖南华菱线缆股份有限公司申请的“一种基于电缆表面特征监测的电阻预测方法”专利...
鑫磊防护取得人防通风智能控制箱... 金融界2025年8月23日消息,国家知识产权局信息显示,福建省鑫磊防护设备有限公司取得一项名为“一种...
迦南科技公布“一种便于对物料进... 天眼查APP显示,近日,浙江迦南科技股份有限公司申请的“一种便于对物料进行定位的链条层间提升机”专利...
海南将防汛防风Ⅲ级应急响应提升... 海南省防灾减灾救灾委员会 关于将防汛防风Ⅲ级应急响应提升至 Ⅱ级应急响应的通知 各市、县、自治县防汛...
时事开讲第261期|科技热浪,... 潮新闻客户端 记者 郭闻 1 这个夏天,科技新闻与天气一样热,从太空到海底到大地,各类有关科技最新研...
科技创新赋能 中小企业迸发发展... 在东营广大金科机器人有限公司的生产车间内,一台新研发上市的热成形生产设备正加紧调试安装。这款热成形加...
月球“休眠”为何还有火山喷发?... (来源:辽宁日报) 转自:辽宁日报 新华社记者 胡喆 马晓澄 已经“休眠”的月球,依然发生火山喷发,...
图像缩放攻击突破Google ... 来源:至顶网 Trail of Bits的安全研究人员发现,Google Gemini CLI和其...