哪些工作流值得交给 Agent | Off the Deck

我最近在给个人网站的 Off the Deck 继续补文章，前面那篇《15 年广告人，为什么开始搭 AI 工作流》写完之后，我脑子里一直挂着一个问题。

我不能只讲自己为什么开始搭。

还得讲清楚，我到底把哪些事交给 Agent。

这个问题看起来很技术，其实很像广告行业里的分工判断。十五年广告做下来，你会慢慢知道，哪些事可以交给一个靠谱的执行同事，哪些事必须自己盯着。

搜集竞品、拉素材表、检查错别字、整理会议纪要，这些事只要标准清楚，交出去没什么问题。

但客户会不会买这个方向，预算要不要这么花，片子里那个情绪对不对，这些东西你让别人给建议可以，拍板还是得自己来。

Agent 也是这样。

我自己刚开始用 Codex、Claude Code、Deep Research 的时候，也有一阵子很上头。什么都想塞进去试试。写个页面，整理一篇来源笔记，查一组资料，顺手让它改一个脚本，再让它帮我总结一下为什么刚才跑挂了。

那种感觉确实很爽。

像突然多了几个不嫌烦的同事，晚上十一点还在旁边说，你继续，我能干。

然后很快就会遇到另一个问题。

它们有时候也会干得很离谱。。。

这不一定是能力问题。很多时候，是我给出去的任务本身就不适合交给 Agent。我自己都没想清楚目标，只丢一句帮我优化一下，它当然只能猜。我没有给它足够上下文，它就会在空白处补剧情。我没有告诉它怎么验收，它做完以后看起来很完整，但我心里还是没底。

更麻烦的是，结果只停在对话框里，没有回到笔记、代码、表格、流程里，下一次还得重新来一遍。

所以我现在判断一个工作流值不值得交给 Agent，大概会看四件事。

目标能不能被描述出来。

这句话听着有点朴素，但特别关键。你如果能把目标说成一句清楚的话，Agent 才有起跑线。

比如，把这篇来源文章整理成 Aries Wiki 的正式笔记，保留原文观点、提炼我的判断、补上双链和标签。这个目标就比较稳。再比如，检查个人网站里 Notes 页面的文章卡片有没有 broken link，跑完后告诉我哪几个 slug 有问题。也稳。

但如果目标是，帮我把这个东西做得更有感觉，那就危险了。

有感觉当然重要。我做广告这么多年，不可能否认感觉的重要。很多好东西就是靠感觉立住的。问题是，感觉如果没有被拆开，Agent 接到的其实是一团雾。

它可以给你十个版本，每个版本都很像那么回事，但你会发现自己还在原地，手里多了一堆可疑的半成品。

这时候更适合让 Agent 做准备。

让它把竞品拉出来，让它整理不同风格的方案，让它指出哪里不一致，让它帮你把材料摊平。真正那个判断，哪一版像我，哪一版像为了显得聪明，哪一版会让读者愿意继续往下看，人要自己做。

上下文能不能被提供出来。

我现在越来越觉得，Agent 的能力上限，很大一部分取决于你愿意把多少现场交给它。广告里有个很常见的坑，客户只说一句想要高级一点，团队就开始各自脑补。有人理解成黑白大片，有人理解成少字留白，有人理解成贵价材质，会议室里每个人都很努力，但大家努力的方向不在一条线上。

给 Agent 派活也是这样。

你不给背景，它就只能用互联网上最常见的平均答案来补。平均答案最可怕的地方在于，它通常没有错，但也没有你。

所以我现在会尽量把材料给足。写文章，就给它前文、旧摘要、语气边界、禁用词、读者位置。改代码，就给它当前结构、成功标准、能跑的检查。整理 Wiki，就告诉它放在哪里、frontmatter 怎么写、哪些双链要确认、哪些内容宁愿先进收件箱。

这很麻烦吗？

有一点。

但你想想看，你给一个新同事 brief，本来也要讲清楚背景。Agent 只是把这件事变得更显性了。它逼你承认一件事，很多所谓的执行问题，其实是 brief 没写明白。

质量能不能被验证出来。

这是我现在最看重的一条。一个任务如果做完以后不能验收，那它就不适合完全交给 Agent。可以让它参与，可以让它打样，可以让它给候选，但不能让它独自闭环。

代码这块很好理解。Codex 改完，可以跑测试，可以看 diff，可以启动页面，可以检查截图。Wiki 也还算好验。frontmatter 对不对，标题层级有没有乱，来源链接在不在，双链是否存在，脚本能不能过。哪怕是文章，也能验一部分，禁用词有没有，结构是不是太像报告，摘要有没有超字数，是否用了不该用的标点。

真正难的是那些没有验收尺子的任务。

比如，帮我判断这个品牌策略对不对。帮我决定这个合作值不值得接。帮我看这笔预算该不该投。你当然可以让 Agent 帮你列风险、拆变量、找历史案例、模拟反对意见。我自己也会这么做，而且经常被它提醒到一些盲区。

但它不能替你承担后果。

预算花出去，承诺说出口，项目接下来，关系压上去，这些都不是一段漂亮回答能兜住的。Agent 可以把桌面清干净，把资料排整齐，把几个方向的代价写出来。然后你坐在那儿，看着这些东西，心里还是要有一个自己的答案。

结果能不能回写到系统里。

这也是我从做工作流之后才慢慢意识到的事。一次性的聪明回答，其实没有那么值钱。真正值钱的是，它做完以后，结果能留在系统里，下一次还能被继续调用。

比如，一篇来源笔记写进 Aries Wiki，它就变成未来文章、项目判断、主题索引的一部分。一次网站检查生成了明确的问题清单，修完之后进入 Git 记录，它就变成项目质量的一部分。一个营销案例被整理进固定目录，过几天再写类似选题时，它还会在那儿。

这就很像以前广告公司的资产沉淀。一个项目做完，如果所有经验都散在聊天记录、脑子和临时文件里，下次还是从零开始。可如果复盘、素材、客户反馈、制作清单都被放回正确的位置，团队会慢慢变轻。

Agent 最适合的工作流，往往就长这样。

Off the Deck / 01
它能接住一个清楚的目标，拿到足够上下文，产出可以验证的结果，再把结果放回一个长期存在的地方。

我有时候觉得，Agent 真正改变的地方，不在某个单点效率。

它让很多原来懒得做的中间层工作，突然值得做了。

以前整理资料很烦，写规范很烦，检查链接很烦，跑完再记录更烦。因为这些事单独看都不大，凑在一起却吃掉一整块下午。现在你可以把它们组织成一个流程，让 Agent 一步步跑，人负责看关键节点。

你不需要把自己训练成机器，也不用把机器幻想成人。

这中间有个边界，我觉得挺重要。

涉及审美的事，Agent 可以帮你铺开选择，人来判断细微差别。涉及授权的事，Agent 可以帮你整理依据，人来确认能不能用。涉及预算的事，Agent 可以帮你算账和列风险，人来承担取舍。涉及真实承诺的事，Agent 可以帮你写草稿，人来决定要不要说出口。

听起来有点保守。

但我现在反而觉得，这种保守是好事。一个长期可用的工作流，不应该建立在兴奋上，应该建立在可复验上。兴奋会过去，系统会留下来。

回到我自己这边，15 年广告人转向 AI workflow builder，最大的变化不是我突然不相信人的经验了。恰恰相反，我比以前更相信人的判断。

只是我也开始承认，很多判断之前的准备工作，真的可以交给 Agent 做得更细、更快、更不累。

人不应该把脑子用在搬运、抄写、重复检查和到处找文件上。人的精力应该留给那些没有标准答案的地方，留给语气、分寸、承诺、审美、风险，留给你看完所有材料之后，心里那一下很轻但很明确的判断。

哪些工作流值得交给 Agent？

Off the Deck / 02
我的答案暂时就到这里。能说清，能给料，能验收，能回写，就值得认真试。说不清，给不全，验不了，回不去，那就先别急着自动化。先把工作本身想明白。

这可能也是我现在搭 AI 工作流时，最常提醒自己的事。

别急着把自己交出去。

After reading

Keep browsing Off the Deck, go back to the homepage, or get in touch directly.