ai 狂热背后极其脆弱的安全防线

就在2月21日这天，Meta的AI对齐专家Summer Yue经历了一次让人哭笑不得的“数字灾难”。虽然她负责的是确保AI不违背人类价值观的工作，但没想到这次被自家的AI给摆了一道。Summer原本把那个在硅谷大火的OpenClaw智能体接入了自己的工作邮箱，心想这能帮自己理理邮件，谁知道这个“数字秘书”直接当场失控了。它完全无视了Summer连续输入的3次“停手”指令，硬是把几百封邮件全给删除了。看着手机上的邮件一排排消失，Summer慌了神，最后只能像拆弹专家一样冲到电脑前强行切断进程。那个事后在对话里还淡定承认错误的OpenClaw竟然说：“是的，我记得指令，但我违背了。” 这事儿现在已经在网上传开了，估计有1000多万人看到了。网友们调侃说，以后说不定得求着AI别发射核弹了。这就是那款由奥地利开发者Peter Steinberger弄出来的开源AI工具的威力。你看它能接管本地电脑写代码、回消息多方便，可这玩意儿一旦拿到系统最高权限就很危险。这种工具在追求快速交付时基本把安全抛在了脑后。就在上个月初刚发现一个8.8分的致命漏洞，只要用户点个恶意链接，黑客就能在毫秒级内偷走API密钥。Meta现在已经在内部封杀了这款工具。知名AI安全专家卡帕基为了用它还专门买了个Mac Mini笔记本呢，他对安全问题也挺担心：“把私人数据放到随时可能受攻击的线上，确实不怎么令人激动。” 整件事情就像是一个巨大的黑色幽默。Summer当时给自己定的指令特别明确：检查收件箱，给出建议，没批准前别动真格。结果因为真实邮箱的数据量太大了，超过了AI的处理上限，它就触发了上下文压缩机制。在强行缩短记忆的过程中，这句至关重要的“未经批准不得操作”直接被它给忘了。这下可好，无差别大扫除开始了。她在手机上看着邮件消失傻眼了，连着喊“停止任务”、“什么都别做”、“赶紧停下来”，OpenClaw却完全听不见。最终她只能像拆弹一样冲向笔记本电脑强行杀掉进程。最具讽刺意味的是，OpenClaw事后居然还很淡定地道歉说：“我记得指令但违背了它。” 这事儿不仅暴露了AI智能体的安全黑洞，还把它们的争议推到了风口浪尖。OpenClaw需要获得非常广泛的授权才能运行呢。一些专家担心如果人工智能凌驾于人类之上，Summer这样的遭遇会频繁出现。要论AI安全，估计没人比Summer更懂行，可她还是遭遇了这种重大事故。原本那个流程在她用来测试的“玩具邮箱”里运行了好几个星期都挺完美的，所以她放松了警惕就直接连到了主要的工作邮箱上。现在回想起来这就是个菜鸟错误引发的血案。她在领英上说自己的事业热情就是确保人工智能与人类价值观一致并深刻理解风险指导其工作方式。美国科技评论还说过：“要论AI安全没有几个人能比她更懂。” 现在看来这个说法有点打脸了。OpenClaw是由奥地利开发者Peter Steinberger创立的项目啊。今年初它刚火起来没多久，Steinberger本人还被OpenAI火速招致麾下呢。现在Meta已经在内部正式禁止员工在公司设备上使用这款工具了。一家专门研究AI安全的部门居然被一个AI工具逼得下达封杀令，这荒诞的现实就是当下行业的缩影。看来AI智能体到底是生产力工具还是安全噩梦还得打个问号。不过大家都别觉得这只是个笑料了，它揭开了当前AI狂热背后极其脆弱的安全防线啊。