Continue? Y/N:一个 60 秒小游戏,戳穿你对 AI 授权的「点确认疲劳」

查看原文 HN 讨论

文章摘要

Continue? Y/N(副标题「你读 AI 命令到底有多仔细?」)是一个只玩 60 秒的浏览器小游戏,主题是 AI 智能体的「授权疲劳」(permission fatigue)。如今用 Claude Code、Cursor 这类编程智能体时,工具会不断弹出「是否允许执行此命令?Y/N」的确认框;玩这个游戏,你要在飞快闪过的一连串命令请求里快速判断该批准还是拒绝,同时躲开混在其中的恶意操作。游戏精准地讽刺了一个真实现象:当确认框来得太频繁,人就会条件反射地一路点「同意」,从而放过真正危险的命令。

游戏机制本身也成了一面镜子,暴露出 AI 授权模型的深层矛盾。玩家很快发现一个「漏洞」:只要无脑全部拒绝、且拒得够快,就能拿到满分安全分(但会被标记为「过度拦截 overblocked」);而全部批准,恶意弹窗就会拖慢你——形成一个左右为难的两难局面。作者 Wirbelwind 随后对「全拒绝」策略做了削弱(nerf),并单独给它起了个称号。

围绕游戏的讨论延伸出对威胁模型(threat model)的认真辩论:批准 npm run build 看似无害,但智能体完全可以在此之前偷偷修改 package.json 或往 node_modules 注入恶意代码;README 里的 npm 仓库配置改动也可能指向外部域名,构成真实的供应链攻击(supply-chain attack)风险。作者还附上一篇博客分析了实际风险,并提到「自动模式(Auto Mode)」存在约 17% 的漏报率(false-negative rate)

HN 评论精华