AI时代：人类作为超级甲方的新定位

发布时间：2026-05-25 02:01阅读：13

这个问题我思考了将近一年。我的结论是：AI是超级乙方，我们则是超级甲方。

即便大模型原地踏步，AI替代我们的趋势也已不可逆转，而且替代范围会持续扩大。它不一定是某个岗位突然消失，更像是各种能力被一点点蚕食。文案、代码、绘图、数据报表、方案撰写、资料检索、页面生成，这些曾经能养活一个人的技能，如今都在贬值。

因此许多人的担忧并非无病呻吟。应届学生会疑虑，等自己毕业时这个行业是否还存在？工作三五年的职场人也会担忧，现在积累的经验明年是否还有价值？

我后来意识到，或许应该换个角度。与其追问“哪个岗位无法被替代”，不如思考：“当AI充当超级乙方时，哪些事情必须由人来做？哪些是AI无法胜任的？”

技能当然仍有价值，但单靠技能会越来越不稳定。能否准确承接问题，开始变得更加重要。

以这句话为例。

“实现一个AI总结功能。”

这句话听起来似乎没什么毛病。竞争对手有了，老板要上线，用户应该也不排斥。丢给Claude Code，PRD、Story、页面、接口、测试，一路顺畅。几小时后，一个可运行的功能就完成了。

上线后问题才暴露。

客服主管真正缺少的并非“总结”。他需要的是每天早上9点，从200条工单中立刻识别出哪几条会爆发、哪些客户即将超时、哪类问题需要优先处理。

AI没有做错。它只是把一个模糊的需求，执行得过于迅速了。

同样的问题也会出现在运营、销售、内容和设计领域。让AI整理企微群，如果没有明确“给谁看、明天要做什么决策”，它就会给你一份漂亮但无用的纪要。让AI整理腾讯文档表格，如果没有明确“要筛选哪类线索”，它就会把每列都解释一遍。

毫无疑问，在错误方向上跑得越快，离目标越远。

AI让交付变快了，也让没想清楚的东西更快撞墙。先别急着开工，先把问题钉住。

POSITIONING

我后来意识到，很多别扭感不来自AI不够强大，更多是我们悄悄把它放在了产品负责人的位置上。

如果把AI当成“超级乙方”呢？它很能干，但它不会替我们承担当初为什么要做的责任。

乙方再强，也还是要等甲方把目标、限制、验收、责任讲明白。

比起让AI跑久一点（之前Harness是这么搞哈哈），我现在更追求别让AI高速跑偏，少让我纠正。

BEFORE STARTING

“甲方”这个词，平时不太讨喜。大家容易想到改稿、拍脑袋、今天要高级感明天要松弛感。

我这里说的甲方，不是挑毛病那种。更像是在开工前把桌面擦干净：目标、限制、证据、责任，谁都别靠猜。

任务有风险时，别从“开写”开始，先问“什么算对”。

还是刚才那个客服例子。我不会让AI直接开写，会先把它压成一张能验收的任务卡。

这张卡一出来，AI的工作范围反而变窄了。它不用猜“总结得好不好”，只要围绕分诊结果交付。当然实际工作中未必要这么死板，最重要的是我们要知道这个需求为什么做，哪些暂时可以不做？

“做个官网”“优化首页”“加个注册功能”“做个AI总结”，都能开工，也都容易返工。

少了用户、场景、痛点、约束、指标，AI就会自己补脑。

最后一行最容易被漏掉。很多团队会做加法，只是一直不好意思做减法。

AI默认接单，我们别默认接单。需求来了，我会先问这几句。

拿刚刚的客服举例，“竞品有AI总结”问到最后，常常会变成“客服SLA连续超标”。这时候任务就变了。你要的可能是风险分诊、告警、置顶、知识库检索，不一定是总结。

AI很擅长给“都要”的方案。又好看，又高级，又便宜，又安全，还能增长。听上去舒服，落地时痛苦。

很多时候这就变成了过度设计，我们要保证的是交付的东西足够可靠、有用，而不只是单纯的多或者看起来可以。

没有反目标，过度设计就会如影随形。我前两天刚花了一天时间改AI的过度设计。

“专业一点”“更高级”“体验好一些”，这些话在会里能讲，不能拿来验收。

如果我是产品主理人，我会尽量改成这种写法：

页面上线前要满足：

· 3秒内能看懂产品面向谁

· 首屏出现一句主价值表达

· 主CTA只有一个

· 375px移动端无横向滚动

· 5名目标用户里，至少4人能复述产品用途

这其实和TDD（测试驱动开发）类似：先把“对”写出来，再让AI去靠近它。

写代码时，证据是失败测试变绿、E2E路径跑通、必要日志能查到。做页面时，证据可能是用户复述、可用性测试、端到端路径、数据看板。感觉可以参与讨论，别让它独自负责验收。

AI可以生成方案，但不会替我们处理上线事故，也不可能替我背锅。AI不可能把人都干掉就是因为人终究要负责这些事那些事，只要负责了，乱七八糟的事就少不了。

大的需求我们更需要责任闭环：

上线变容易以后，我觉得负责这件事反而要更早写清楚。所谓丑话说前面。

ASSET BOX

有时候我们需要把AI从执行状态拽回定义状态：

A HIDDEN RISK

AI很容易一次给你十个方案。看起来热闹，其实可能只是十次换皮。

让它做科技感Logo，它大概率会给你一堆蓝紫渐变、发光线条、抽象几何。数量多，假设少。

Science Advances 2024年有篇研究挺有意思：生成式AI能提高单个故事的创造力评分、可读性和愉悦度，尤其能帮到原本不太擅长创作的人；但AI辅助产出的故事之间相似度也更高。

所以AI能把每个点子打磨得更像样，也可能让团队越想越像。

左边是在同一个方向上抛光，右边是在逼自己换假设。AI很会做左边，我们要多要一点右边。

我现在不太问“给我十版”。我会改问：“这十版分别基于什么不同假设？”

这里我更愿意把AI当sounding board：帮我暴露假设、制造反例、拉开对照。把它当ghostwriter时，它很容易只是在同一个方向上润色十遍。

EVIDENCE

Harvard Business School和BCG做过一个实验，758名咨询顾问使用GPT-4完成真实咨询任务。在AI擅长的任务里，顾问做得更快，质量也更高。可在一个更复杂的品牌策略任务上，用AI的人反而更容易答错。

研究者把这种现象叫“锯齿状技术边界”。AI的能力边界不是平滑线。有些看起来难的事，它能做；有些看起来差不多的事，它会一本正经地带你跑偏。

我读完这个实验后的感受是：“它能不能做”不是唯一问题。还要提前写清：错了怎么发现、谁拍板、谁验收、谁回滚。

Anthropic Economic Index也给了一个现实观察：AI在工作里更多是按任务渗透，有些任务被自动化，有些任务被增强。岗位未必消失，但岗位里的任务结构会被拆开重排。

放到运营场景里，就是“整理群聊”这种活更容易交给AI；但“哪些客户风险要进明早例会”“哪条线索该销售总监亲自跟”，还得有人拍板。

落到团队里，返工次数、线上事故、会后争议会更显眼。能提前做清楚定义、判断、校准、追责，就少吃很多亏。

WEEKLY REVIEW

“本周生成了多少代码”“省了多少小时”“调用了多少次模型”，可以看，但我不会把它们当主指标。

它们只说明AI干了多少，不说明我们有没有把问题定义得更清楚。

如果我是TL，我会先抓“需求重构率”。重点在于大家驾驭AI的水平，不返工，而不在于用AI写了多少。

如果重一点，还可以复盘下：

EVERYDAY WORK

产品经理、运营、设计、销售、工程负责人也会遇到同一类问题。

运营同学让AI整理企业微信群聊，如果只说“总结一下”，大概率会得到一份没法进早会的纪要。补上“给谁看、明天早会要做什么决策、哪些客户风险必须提出来”，结果会完全不一样。

销售同学整理客户拜访纪要，漂亮摘要不值钱。成交阻力、下一步动作、谁负责跟进、几号前触达，才会进入CRM和日程。

设计同学让AI出品牌方向，“高级一点”太滑了。先判断现在缺融资信任、用户亲和，还是行业专业感。

工程负责人让AI写代码，测试绿了只是底线。埋点、边界条件、回滚方案、线上值班，也要一起进任务定义。

场景不一样，底层动作很像：把活定义清楚。

运营同学可以在活动复盘表里直接加这几列：

· 这次要做的决策

· AI只负责整理什么

· 这次不处理什么

· 明天谁拿结果继续跟进

AI会继续变强。执行会继续变便宜。文案、代码、页面、方案，都会更容易生成。

如果只看“能不能产出”，人确实越来越难赢。机器不累，不尴尬，不拖延，还能同时开几十条线。

但一个错误问题，可以消耗掉一万个漂亮答案。

所以不能被替代的，可能不是某种固定技能。技能会被拆、会被学、会被自动化。我想，面对不确定的现实，愿意定义目标、给判断、做取舍、承担后果，才是普通打工人不会被替代的。

相比“怎么让AI多干活”，不如开工前多慢一分钟，让AI做的确实能对结果负责。

AI可以把东西抛得很快，但问题、取舍、证据和后果，总得有人接住。

最后落到日常里，其实就是几句普通话：

我们到底在解决谁的问题？

什么结果能证明做对了？

这次明确不做什么？

如果失败，怎么发现？

如果出事，谁负责？

欢迎大家交流下如何面对AI带来的就业冲击..

REFERENCES

· Harvard Business School / BCG：Navigating the Jagged Technological Frontier

· Science Advances：Generative AI enhances individual creativity but reduces the collective diversity of novel content

· Anthropic Economic Index

· NIST AI Risk Management Framework

CC4PM · Claude Code for Product Maker

Lesson 22.7 · 超级甲方

← 上一篇：AI时代的失业焦虑与产业泡沫解析下一篇：上海人工智能训练师考证领补攻略：最高4550元 →