anthropic 这家公司用claude 这个ai 系统玩了一个大动作，它在6 小时内花了200 美元，就

Anthropic这家公司用Claude这个AI系统玩了一个大动作，它在6小时内花了200美元，就把一个复古游戏编辑器给独立搞出来了。这事儿让业界彻底改变了对AI的看法，大家开始把它看成是能搞定完整项目的家伙。那次实验挺猛的，Anthropic公司直接把任务扔给Claude：“去做一个复古游戏编辑器。”然后就没管它，让它自己埋头干。以前那种只懂一个指令的AI肯定不行，二十分钟就开始瞎折腾，弄出来的框架要么没法用，要么功能不全。但Claude不一样，它靠着多智能体架构干了整整6个小时，最后弄出了16个功能，还把27项验收标准全都给过了。为啥能这么神？关键在于他们搞了个三智能体分工。首先是Planner规划者，它把模糊的需求变成了包含10个冲刺的详细计划书；接着是Generator执行者去写代码和弄系统；最后还有evaluator评估者盯着质量，不光看代码对不对，还量化打分设计好不好。这样分工的好处是让AI不再迷路，不会自以为是地瞎迭代。数据也挺能说明问题。在做数字音频工作站的时候，评估系统因为对波形精度这些细节不满意，硬是逼着Generator改了13次代码，最后才让产品达到了专业级水平。这说明光靠做大模型参数不管用，关键得靠团队协作。技术头头说这就是结构化协作的胜利。评估模块用了个动态算法，硬生生把设计创新指标提升到了35%，逼着系统跳出安全框框，搞出了有艺术感的方案。这说明当大家生成的东西都差不多时，谁能做好评价体系才是赢面最大的。这次实验带来的震撼太大了。当AI能把需求分析、编码和测试这一套活儿全包了的时候，以前那些固定的分工界限就不存在了。这种变化不光让专业开发变得容易多了，还把竞争重点转向了创意——现在大家都在想：怎么才能提出一个值得AI花几百美元算力去干的好点子？这已经成了数字时代的新挑战。