Anthropic这家公司用Claude这个AI系统玩了一个大动作,它在6小时内花了200美元,就把一个复古游戏编辑器给独立搞出来了。这事儿让业界彻底改变了对AI的看法,大家开始把它看成是能搞定完整项目的家伙。 那次实验挺猛的,Anthropic公司直接把任务扔给Claude:“去做一个复古游戏编辑器。”然后就没管它,让它自己埋头干。以前那种只懂一个指令的AI肯定不行,二十分钟就开始瞎折腾,弄出来的框架要么没法用,要么功能不全。但Claude不一样,它靠着多智能体架构干了整整6个小时,最后弄出了16个功能,还把27项验收标准全都给过了。 为啥能这么神?关键在于他们搞了个三智能体分工。首先是Planner规划者,它把模糊的需求变成了包含10个冲刺的详细计划书;接着是Generator执行者去写代码和弄系统;最后还有evaluator评估者盯着质量,不光看代码对不对,还量化打分设计好不好。这样分工的好处是让AI不再迷路,不会自以为是地瞎迭代。 数据也挺能说明问题。在做数字音频工作站的时候,评估系统因为对波形精度这些细节不满意,硬是逼着Generator改了13次代码,最后才让产品达到了专业级水平。这说明光靠做大模型参数不管用,关键得靠团队协作。 技术头头说这就是结构化协作的胜利。评估模块用了个动态算法,硬生生把设计创新指标提升到了35%,逼着系统跳出安全框框,搞出了有艺术感的方案。这说明当大家生成的东西都差不多时,谁能做好评价体系才是赢面最大的。 这次实验带来的震撼太大了。当AI能把需求分析、编码和测试这一套活儿全包了的时候,以前那些固定的分工界限就不存在了。这种变化不光让专业开发变得容易多了,还把竞争重点转向了创意——现在大家都在想:怎么才能提出一个值得AI花几百美元算力去干的好点子?这已经成了数字时代的新挑战。