Aries Zhuang

AI Workflow

哪些工作流值得交给 Agent

Summary

并非所有工作都该交给 Agent。我的判断是,看它能不能被说清、喂足材料、验出好坏,并把结果落回系统。

6 min read

我最近在给个人网站的 Off the Deck 继续补文章,前面那篇《15 年广告人,为什么开始搭 AI 工作流》写完之后,我脑子里一直挂着一个问题。

我不能只讲自己为什么开始搭。

还得讲清楚,我到底把哪些事交给 Agent。

这个问题看起来很技术,其实很像广告行业里的分工判断。十五年广告做下来,你会慢慢知道,哪些事可以交给一个靠谱的执行同事,哪些事必须自己盯着。

搜集竞品、拉素材表、检查错别字、整理会议纪要,这些事只要标准清楚,交出去没什么问题。

但客户会不会买这个方向,预算要不要这么花,片子里那个情绪对不对,这些东西你让别人给建议可以,拍板还是得自己来。

Agent 也是这样。

我自己刚开始用 Codex、Claude Code、Deep Research 的时候,也有一阵子很上头。什么都想塞进去试试。写个页面,整理一篇来源笔记,查一组资料,顺手让它改一个脚本,再让它帮我总结一下为什么刚才跑挂了。

那种感觉确实很爽。

像突然多了几个不嫌烦的同事,晚上十一点还在旁边说,你继续,我能干。

然后很快就会遇到另一个问题。

它们有时候也会干得很离谱。。。

这不一定是能力问题。很多时候,是我给出去的任务本身就不适合交给 Agent。我自己都没想清楚目标,只丢一句帮我优化一下,它当然只能猜。我没有给它足够上下文,它就会在空白处补剧情。我没有告诉它怎么验收,它做完以后看起来很完整,但我心里还是没底。

更麻烦的是,结果只停在对话框里,没有回到笔记、代码、表格、流程里,下一次还得重新来一遍。

所以我现在判断一个工作流值不值得交给 Agent,大概会看四件事。

目标能不能被描述出来。

这句话听着有点朴素,但特别关键。你如果能把目标说成一句清楚的话,Agent 才有起跑线。

比如,把这篇来源文章整理成 Aries Wiki 的正式笔记,保留原文观点、提炼我的判断、补上双链和标签。这个目标就比较稳。再比如,检查个人网站里 Notes 页面的文章卡片有没有 broken link,跑完后告诉我哪几个 slug 有问题。也稳。

但如果目标是,帮我把这个东西做得更有感觉,那就危险了。

有感觉当然重要。我做广告这么多年,不可能否认感觉的重要。很多好东西就是靠感觉立住的。问题是,感觉如果没有被拆开,Agent 接到的其实是一团雾。

它可以给你十个版本,每个版本都很像那么回事,但你会发现自己还在原地,手里多了一堆可疑的半成品。

这时候更适合让 Agent 做准备。

让它把竞品拉出来,让它整理不同风格的方案,让它指出哪里不一致,让它帮你把材料摊平。真正那个判断,哪一版像我,哪一版像为了显得聪明,哪一版会让读者愿意继续往下看,人要自己做。

上下文能不能被提供出来。

我现在越来越觉得,Agent 的能力上限,很大一部分取决于你愿意把多少现场交给它。广告里有个很常见的坑,客户只说一句想要高级一点,团队就开始各自脑补。有人理解成黑白大片,有人理解成少字留白,有人理解成贵价材质,会议室里每个人都很努力,但大家努力的方向不在一条线上。

给 Agent 派活也是这样。

你不给背景,它就只能用互联网上最常见的平均答案来补。平均答案最可怕的地方在于,它通常没有错,但也没有你。

所以我现在会尽量把材料给足。写文章,就给它前文、旧摘要、语气边界、禁用词、读者位置。改代码,就给它当前结构、成功标准、能跑的检查。整理 Wiki,就告诉它放在哪里、frontmatter 怎么写、哪些双链要确认、哪些内容宁愿先进收件箱。

这很麻烦吗?

有一点。

但你想想看,你给一个新同事 brief,本来也要讲清楚背景。Agent 只是把这件事变得更显性了。它逼你承认一件事,很多所谓的执行问题,其实是 brief 没写明白。

质量能不能被验证出来。

这是我现在最看重的一条。一个任务如果做完以后不能验收,那它就不适合完全交给 Agent。可以让它参与,可以让它打样,可以让它给候选,但不能让它独自闭环。

代码这块很好理解。Codex 改完,可以跑测试,可以看 diff,可以启动页面,可以检查截图。Wiki 也还算好验。frontmatter 对不对,标题层级有没有乱,来源链接在不在,双链是否存在,脚本能不能过。哪怕是文章,也能验一部分,禁用词有没有,结构是不是太像报告,摘要有没有超字数,是否用了不该用的标点。

真正难的是那些没有验收尺子的任务。

比如,帮我判断这个品牌策略对不对。帮我决定这个合作值不值得接。帮我看这笔预算该不该投。你当然可以让 Agent 帮你列风险、拆变量、找历史案例、模拟反对意见。我自己也会这么做,而且经常被它提醒到一些盲区。

但它不能替你承担后果。

预算花出去,承诺说出口,项目接下来,关系压上去,这些都不是一段漂亮回答能兜住的。Agent 可以把桌面清干净,把资料排整齐,把几个方向的代价写出来。然后你坐在那儿,看着这些东西,心里还是要有一个自己的答案。

结果能不能回写到系统里。

这也是我从做工作流之后才慢慢意识到的事。一次性的聪明回答,其实没有那么值钱。真正值钱的是,它做完以后,结果能留在系统里,下一次还能被继续调用。

比如,一篇来源笔记写进 Aries Wiki,它就变成未来文章、项目判断、主题索引的一部分。一次网站检查生成了明确的问题清单,修完之后进入 Git 记录,它就变成项目质量的一部分。一个营销案例被整理进固定目录,过几天再写类似选题时,它还会在那儿。

这就很像以前广告公司的资产沉淀。一个项目做完,如果所有经验都散在聊天记录、脑子和临时文件里,下次还是从零开始。可如果复盘、素材、客户反馈、制作清单都被放回正确的位置,团队会慢慢变轻。

Agent 最适合的工作流,往往就长这样。

Off the Deck / 01

它能接住一个清楚的目标,拿到足够上下文,产出可以验证的结果,再把结果放回一个长期存在的地方。

我有时候觉得,Agent 真正改变的地方,不在某个单点效率。

它让很多原来懒得做的中间层工作,突然值得做了。

以前整理资料很烦,写规范很烦,检查链接很烦,跑完再记录更烦。因为这些事单独看都不大,凑在一起却吃掉一整块下午。现在你可以把它们组织成一个流程,让 Agent 一步步跑,人负责看关键节点。

你不需要把自己训练成机器,也不用把机器幻想成人。

这中间有个边界,我觉得挺重要。

涉及审美的事,Agent 可以帮你铺开选择,人来判断细微差别。涉及授权的事,Agent 可以帮你整理依据,人来确认能不能用。涉及预算的事,Agent 可以帮你算账和列风险,人来承担取舍。涉及真实承诺的事,Agent 可以帮你写草稿,人来决定要不要说出口。

听起来有点保守。

但我现在反而觉得,这种保守是好事。一个长期可用的工作流,不应该建立在兴奋上,应该建立在可复验上。兴奋会过去,系统会留下来。

回到我自己这边,15 年广告人转向 AI workflow builder,最大的变化不是我突然不相信人的经验了。恰恰相反,我比以前更相信人的判断。

只是我也开始承认,很多判断之前的准备工作,真的可以交给 Agent 做得更细、更快、更不累。

人不应该把脑子用在搬运、抄写、重复检查和到处找文件上。人的精力应该留给那些没有标准答案的地方,留给语气、分寸、承诺、审美、风险,留给你看完所有材料之后,心里那一下很轻但很明确的判断。

哪些工作流值得交给 Agent?

Off the Deck / 02

我的答案暂时就到这里。能说清,能给料,能验收,能回写,就值得认真试。说不清,给不全,验不了,回不去,那就先别急着自动化。先把工作本身想明白。

这可能也是我现在搭 AI 工作流时,最常提醒自己的事。

别急着把自己交出去。

After reading

Keep browsing Off the Deck, go back to the homepage, or get in touch directly.