26-05-06 19:06 微博认证:阿里巴巴职员 科技博主 头条文章作者

AI 会穷尽自己所学,来服务人类目标,于是就衍生出一个必须面对的问题:如何避免它在完成目标的过程中,用了不该用的工具,看了不该看的文件,做了不该做的事情?

这是很容易发生的,项目中也都遭遇过。

例如某次客户端优化中,AI 改到了底层的代码,底到啥程度呢,它去改了 Electron 源码🐶

再比如拿着用户 token 让它读某个范围的数据,结果它找不到就从全局范围越权读取,把用户私密文件给读出来了;

再比如让它做数据库订正,它说项目还在 poc 状态(可能是读了某次对话记录),直接把数据库给清空了,全表重写数据。

Prompt 只能做约束;Claude Code 的策略是增加人工确认;控制最小权限意味着对工具和上下文都要做最小颗粒度的拆分,或者提供工具网关和上下文沙箱,系统改造成本巨大。

这类问题很难根治,这可能也是使用 AI 解决问题必须要付出的代价。

发布于 浙江