6月7日消息,据媒体报道,OpenAI近日上线了一项可选的新安全设置——“封锁模式”(Lockdown Mode)。用户开启后,ChatGPT将限制实时联网、深度研究(Deep Research)和智能体模式(Agent Mode)等能力,从而降低敏感数据被提示注入攻击(prompt injection)窃取的风险。
根据OpenAI帮助中心的信息,Lockdown Mode目前已面向所有已登录用户开放,覆盖不同账户类型及工作区。个人用户可在“设置-安全”中开启,工作区管理员则可通过工作区设置和角色权限进行配置。
所谓提示注入攻击,是指攻击者将恶意指令藏匿于网页、文档或其他外部内容中。当 ChatGPT 读取这些内容时,模型可能被诱导忽略原有规则,执行本不该执行的操作,严重情况下甚至可能将用户输入的敏感信息通过联网能力发送至外部服务器。
封锁模式的设计思路并非让模型识别所有恶意指令,而是限制最危险的一环——向外部发起网络请求。
开启后,ChatGPT的实时网页浏览将被限制,仅能访问缓存内容;搜索结果可能不完整、不可用或已过期。同时,模型也不会在普通回复中检索并展示来自网络的图片(用户仍可自行上传图片文件,图片生成功能不受影响)。
此外,深度研究和智能体模式将被关闭;ChatGPT无法从网络下载文件用于数据分析,只能处理用户手动上传的文件;Canvas生成的代码也不能被批准联网访问。
OpenAI同时说明,封锁模式不会改变对话记忆、文件上传、分享对话等功能,也不会影响对话是否被用于改进模型。相关设置仍需通过数据控制或企业管理员权限单独管理。
值得留意的是,OpenAI在帮助文档中明确承认,封锁模式并不能保证提示注入攻击彻底失效。恶意指令仍可能出现在缓存的网页内容里,也可能隐藏于用户上传的文件中,并继续影响ChatGPT的回答行为或准确性。
这也反映出AI产品正面临一个更加现实的问题:模型越能联网、调用工具、代表用户执行任务,其攻击面就越大。智能体模式强调让AI主动访问网页、操作外部服务、完成多步骤任务,而这些能力恰好是提示注入攻击最易利用的入口。
封锁模式为这类能力设置了一道可见的边界。它没有承诺让ChatGPT变得绝对安全,而是将“更强能力”与“更低外泄风险”之间的权衡,交还给用户和管理员。