ai的工作流程是怎样的？

今年刚开始，不少人就在琢磨，以后的AI模型会不会把很多东西都吞了？这个想法其实把很多公司吓了一跳，Adobe、Figma还有美图这些做图像视频的产品也跟着被波及了。但投资机构a16z最近给大家吃了颗定心丸，说在做图像、视频、音频这些内容的时候，根本不会出现有一个大模型就能搞定一切的情况。以后真正能赢的关键是看谁能把多个模型串在一起，做成一个好的工作流。虽说AI现在确实能帮大忙，以前可能要摄影团队拍好几周、剪好几个月的东西，现在只要输入几条提示词就能弄出一堆能用的素材，但这就像之前大语言模型（LLM）那样出现一家独大的情况在这块儿是不会发生的。大多数用户用的时候其实是同时用好几个模型的，而且想弄出一个特别好的成品，光是一个推理也未必行得通。因为每个模型都有自己的强项和短板啊，有的擅长画写实的画，有的动漫风格特别好，或者物理模拟特别强。但这并不代表你用它就能把背景扣干净、声音加进去或者搞定多镜头的叙事场景。实际干活的时候，开发者往往得把好几个模型连起来用：先生成一张图，然后把背景去掉、把分辨率放大、再重新着色、还要保持风格一致……这样才能做出像品牌那样高级的效果。换句话说，真正干活的不是“单枪匹马的一个模型”，而是“一个完整的工作流程”。基于这种多样化的需求，用户真正想要的是那种能快速调用各种模型、处理请求还能编排多步骤流水线的平台软件。随着以后大模型的本事越来越强，那些能把各种模型接进来做成完整工作流的公司竞争力也就会更强。而且它们还能帮着模型厂商把产品从实验室搬到生产第一线去。