4月10日消息,近日,北京智源人工智能研究院、北京邮电大学与中国信息通信研究院联合发布面向OpenClaw的实时安全框架ClawKeeper v1.0。据介绍,该项目首创:技能(Skill)、插件(Plugin)、观察者(Watcher)三位一体的防御架构,旨在提供覆盖智能体全生命周期的安全保护,目前已在GitHub开源,相关研究论文也已同步发布。
图注:ClawKeeper概述图
据了解,随着OpenClaw等智能体获取调用工具、读写文件及控制操作系统的权限,提示注入、密钥泄露、恶意技能等安全风险日益凸显。当前的防御手段多存在覆盖范围碎片化、防御方式被动以及静态防御等局限,往往要求智能体在完成任务和遵守安全合规性之间进行平衡,难以应对不断迭代的安全挑战。
据介绍,智源研究院提供了一种全新的破局思路:用智能体监管智能体。这一范式的核心是:部署一个完全独立于 OpenClaw 业务之外的杀毒软件,不干扰业务执行,却能实现实时拦截和同步进化。既能从“事后复盘”转向“事前防御、事中拦截”,提前规避风险,又能随着 OpenClaw 的能力升级同步更新防御规则,彻底摆脱静态防御的局限,真正打破安全与效率的零和博弈。
图注:ClawKeeper 功能介绍
该框架包含三大防御组件。首先是Skill-based(技能级别防护),在指令层将结构化的安全策略注入到智能体的上下文中,强制执行特定环境的安全边界限制。其次是Plugin-based(插件级别防护),作为内部运行时的强制执行器,负责进行配置加固、主动威胁检测与持续的行为监控。最后是Watcher-based(监管者级别防护),引入解耦的系统级安全中间件,由专门的安全智能体负责监管执行任务的OpenClaw,在关键时刻干预或接管执行流程。
据悉,在基准测试中,ClawKeeper覆盖了提示词注入、凭据泄露、危险命令执行等多种高危场景。其监管者设计实现了安全与任务的解耦,不仅不依赖特定智能体系统,还具备根据安全交互和新风险不断更新自身记忆池的自进化能力。该框架支持本地运行与企业级部署,为智能体系统提供了事前防御与事中拦截的安全基础设施。(袁宁)