ai的工作流程是怎样的?

今年刚开始,不少人就在琢磨,以后的AI模型会不会把很多东西都吞了?这个想法其实把很多公司吓了一跳,Adobe、Figma还有美图这些做图像视频的产品也跟着被波及了。但投资机构a16z最近给大家吃了颗定心丸,说在做图像、视频、音频这些内容的时候,根本不会出现有一个大模型就能搞定一切的情况。以后真正能赢的关键是看谁能把多个模型串在一起,做成一个好的工作流。 虽说AI现在确实能帮大忙,以前可能要摄影团队拍好几周、剪好几个月的东西,现在只要输入几条提示词就能弄出一堆能用的素材,但这就像之前大语言模型(LLM)那样出现一家独大的情况在这块儿是不会发生的。大多数用户用的时候其实是同时用好几个模型的,而且想弄出一个特别好的成品,光是一个推理也未必行得通。 因为每个模型都有自己的强项和短板啊,有的擅长画写实的画,有的动漫风格特别好,或者物理模拟特别强。但这并不代表你用它就能把背景扣干净、声音加进去或者搞定多镜头的叙事场景。实际干活的时候,开发者往往得把好几个模型连起来用:先生成一张图,然后把背景去掉、把分辨率放大、再重新着色、还要保持风格一致……这样才能做出像品牌那样高级的效果。换句话说,真正干活的不是“单枪匹马的一个模型”,而是“一个完整的工作流程”。 基于这种多样化的需求,用户真正想要的是那种能快速调用各种模型、处理请求还能编排多步骤流水线的平台软件。随着以后大模型的本事越来越强,那些能把各种模型接进来做成完整工作流的公司竞争力也就会更强。而且它们还能帮着模型厂商把产品从实验室搬到生产第一线去。