国产Agent这次可是彻底把真人给搬进了手机,让普通人也能像玩游戏一样在安卓、Chrome浏览器和PC桌面之间自由穿梭,这就是ZeroFlow。这款产品是张志勇带着单文榜离开大厂后,拿到近千万天使轮资金孵化出来的。之所以要这么干,是因为他们发现一个人走得更快,“快”比“稳”更重要。当初他们就是想先解决内部痛点,让工程师从写模板、调API的琐碎中解放出来,所以才孵化出了第一代会预判意图的编程智能体。现在这法子被用到了更广阔的知识工作场景里,凡是有重复劳动、有逻辑链条的地方都成了ZeroFlow可以驻扎的根据地。 要让Agent像真人一样看屏幕、点击、滑动、输入,工程上最难的是让模型一次就理解到位。国内网页为了防自动化,把元素藏得比彩蛋还深。ZeroFlow的对策是先用截图定位文本框,再用多模态模型理解语义,把看图识字交给大模型,把动手交给无障碍服务。团队只能不断调参、优化提示词,把Token成本砍到普通用户能承受的区间,普通用户使用的Token成本甚至能降低30%。为了防止被封禁或者引来信任危机,ZeroFlow没有走硬闯生态或者远程虚拟机的路子。它是把Android无障碍服务当成万能遥控器,用系统级接口绕过App封锁。理论上厂商根本没法简单把它关掉。 为了给Agent戴上安全头盔,他们把workspace做成沙箱隔离区。用户密钥、敏感文件被隐藏得连AI自己都找不到。小模型实时监控信息流向,一旦发现高危词汇立刻脱敏加密。这款产品彻底告别了一端一脚本的窘境。过去豆包手机靠高权限硬闯生态却引来了封禁潮;智谱AutoGLM走远程虚拟机信任成本又太高。现在你只要打开浏览器就能用通用Agent去完成复杂的跨端自动化任务。 未来依零科技要把全部精力都砸向功能完善与用户增长。他们要让每台安卓设备、每块屏幕都能被一只真人般的Agent自由操控。这不仅仅是把真人搬进手机那么简单,更是想让普通人也能享受智能解放的第一步。张志勇坚信对于想改变世界的人来说,“快”比“稳”更重要;而零接入成本、打开浏览器就能用的通用Agent正是这种快速解放的第一步。