AI时代:人类作为超级甲方的新定位
这个问题我思考了将近一年。我的结论是:AI是超级乙方,我们则是超级甲方。
即便大模型原地踏步,AI替代我们的趋势也已不可逆转,而且替代范围会持续扩大。它不一定是某个岗位突然消失,更像是各种能力被一点点蚕食。文案、代码、绘图、数据报表、方案撰写、资料检索、页面生成,这些曾经能养活一个人的技能,如今都在贬值。
因此许多人的担忧并非无病呻吟。应届学生会疑虑,等自己毕业时这个行业是否还存在?工作三五年的职场人也会担忧,现在积累的经验明年是否还有价值?
我后来意识到,或许应该换个角度。与其追问“哪个岗位无法被替代”,不如思考:“当AI充当超级乙方时,哪些事情必须由人来做?哪些是AI无法胜任的?”
技能当然仍有价值,但单靠技能会越来越不稳定。能否准确承接问题,开始变得更加重要。
以这句话为例。
“实现一个AI总结功能。”
这句话听起来似乎没什么毛病。竞争对手有了,老板要上线,用户应该也不排斥。丢给Claude Code,PRD、Story、页面、接口、测试,一路顺畅。几小时后,一个可运行的功能就完成了。
上线后问题才暴露。
客服主管真正缺少的并非“总结”。他需要的是每天早上9点,从200条工单中立刻识别出哪几条会爆发、哪些客户即将超时、哪类问题需要优先处理。
AI没有做错。它只是把一个模糊的需求,执行得过于迅速了。
同样的问题也会出现在运营、销售、内容和设计领域。让AI整理企微群,如果没有明确“给谁看、明天要做什么决策”,它就会给你一份漂亮但无用的纪要。让AI整理腾讯文档表格,如果没有明确“要筛选哪类线索”,它就会把每列都解释一遍。
毫无疑问,在错误方向上跑得越快,离目标越远。
AI让交付变快了,也让没想清楚的东西更快撞墙。先别急着开工,先把问题钉住。
POSITIONING
我后来意识到,很多别扭感不来自AI不够强大,更多是我们悄悄把它放在了产品负责人的位置上。
如果把AI当成“超级乙方”呢?它很能干,但它不会替我们承担当初为什么要做的责任。
乙方再强,也还是要等甲方把目标、限制、验收、责任讲明白。
比起让AI跑久一点(之前Harness是这么搞哈哈),我现在更追求别让AI高速跑偏,少让我纠正。
BEFORE STARTING
“甲方”这个词,平时不太讨喜。大家容易想到改稿、拍脑袋、今天要高级感明天要松弛感。
我这里说的甲方,不是挑毛病那种。更像是在开工前把桌面擦干净:目标、限制、证据、责任,谁都别靠猜。
任务有风险时,别从“开写”开始,先问“什么算对”。
还是刚才那个客服例子。我不会让AI直接开写,会先把它压成一张能验收的任务卡。
这张卡一出来,AI的工作范围反而变窄了。它不用猜“总结得好不好”,只要围绕分诊结果交付。当然实际工作中未必要这么死板,最重要的是我们要知道这个需求为什么做,哪些暂时可以不做?
“做个官网”“优化首页”“加个注册功能”“做个AI总结”,都能开工,也都容易返工。
少了用户、场景、痛点、约束、指标,AI就会自己补脑。
最后一行最容易被漏掉。很多团队会做加法,只是一直不好意思做减法。
AI默认接单,我们别默认接单。需求来了,我会先问这几句。
拿刚刚的客服举例,“竞品有AI总结”问到最后,常常会变成“客服SLA连续超标”。这时候任务就变了。你要的可能是风险分诊、告警、置顶、知识库检索,不一定是总结。
AI很擅长给“都要”的方案。又好看,又高级,又便宜,又安全,还能增长。听上去舒服,落地时痛苦。
很多时候这就变成了过度设计,我们要保证的是交付的东西足够可靠、有用,而不只是单纯的多或者看起来可以。
没有反目标,过度设计就会如影随形。我前两天刚花了一天时间改AI的过度设计。
“专业一点”“更高级”“体验好一些”,这些话在会里能讲,不能拿来验收。
如果我是产品主理人,我会尽量改成这种写法:
页面上线前要满足:
· 3秒内能看懂产品面向谁
· 首屏出现一句主价值表达
· 主CTA只有一个
· 375px移动端无横向滚动
· 5名目标用户里,至少4人能复述产品用途
这其实和TDD(测试驱动开发)类似:先把“对”写出来,再让AI去靠近它。
写代码时,证据是失败测试变绿、E2E路径跑通、必要日志能查到。做页面时,证据可能是用户复述、可用性测试、端到端路径、数据看板。感觉可以参与讨论,别让它独自负责验收。
AI可以生成方案,但不会替我们处理上线事故,也不可能替我背锅。AI不可能把人都干掉就是因为人终究要负责这些事那些事,只要负责了,乱七八糟的事就少不了。
大的需求我们更需要责任闭环:
上线变容易以后,我觉得负责这件事反而要更早写清楚。所谓丑话说前面。
ASSET BOX
有时候我们需要把AI从执行状态拽回定义状态:
A HIDDEN RISK
AI很容易一次给你十个方案。看起来热闹,其实可能只是十次换皮。
让它做科技感Logo,它大概率会给你一堆蓝紫渐变、发光线条、抽象几何。数量多,假设少。
Science Advances 2024年有篇研究挺有意思:生成式AI能提高单个故事的创造力评分、可读性和愉悦度,尤其能帮到原本不太擅长创作的人;但AI辅助产出的故事之间相似度也更高。
所以AI能把每个点子打磨得更像样,也可能让团队越想越像。
左边是在同一个方向上抛光,右边是在逼自己换假设。AI很会做左边,我们要多要一点右边。
我现在不太问“给我十版”。我会改问:“这十版分别基于什么不同假设?”
这里我更愿意把AI当sounding board:帮我暴露假设、制造反例、拉开对照。把它当ghostwriter时,它很容易只是在同一个方向上润色十遍。
EVIDENCE
Harvard Business School和BCG做过一个实验,758名咨询顾问使用GPT-4完成真实咨询任务。在AI擅长的任务里,顾问做得更快,质量也更高。可在一个更复杂的品牌策略任务上,用AI的人反而更容易答错。
研究者把这种现象叫“锯齿状技术边界”。AI的能力边界不是平滑线。有些看起来难的事,它能做;有些看起来差不多的事,它会一本正经地带你跑偏。
我读完这个实验后的感受是:“它能不能做”不是唯一问题。还要提前写清:错了怎么发现、谁拍板、谁验收、谁回滚。
Anthropic Economic Index也给了一个现实观察:AI在工作里更多是按任务渗透,有些任务被自动化,有些任务被增强。岗位未必消失,但岗位里的任务结构会被拆开重排。
放到运营场景里,就是“整理群聊”这种活更容易交给AI;但“哪些客户风险要进明早例会”“哪条线索该销售总监亲自跟”,还得有人拍板。
落到团队里,返工次数、线上事故、会后争议会更显眼。能提前做清楚定义、判断、校准、追责,就少吃很多亏。
WEEKLY REVIEW
“本周生成了多少代码”“省了多少小时”“调用了多少次模型”,可以看,但我不会把它们当主指标。
它们只说明AI干了多少,不说明我们有没有把问题定义得更清楚。
如果我是TL,我会先抓“需求重构率”。重点在于大家驾驭AI的水平,不返工,而不在于用AI写了多少。
如果重一点,还可以复盘下:
EVERYDAY WORK
产品经理、运营、设计、销售、工程负责人也会遇到同一类问题。
运营同学让AI整理企业微信群聊,如果只说“总结一下”,大概率会得到一份没法进早会的纪要。补上“给谁看、明天早会要做什么决策、哪些客户风险必须提出来”,结果会完全不一样。
销售同学整理客户拜访纪要,漂亮摘要不值钱。成交阻力、下一步动作、谁负责跟进、几号前触达,才会进入CRM和日程。
设计同学让AI出品牌方向,“高级一点”太滑了。先判断现在缺融资信任、用户亲和,还是行业专业感。
工程负责人让AI写代码,测试绿了只是底线。埋点、边界条件、回滚方案、线上值班,也要一起进任务定义。
场景不一样,底层动作很像:把活定义清楚。
运营同学可以在活动复盘表里直接加这几列:
· 这次要做的决策
· AI只负责整理什么
· 这次不处理什么
· 明天谁拿结果继续跟进
CLOSE
AI会继续变强。执行会继续变便宜。文案、代码、页面、方案,都会更容易生成。
如果只看“能不能产出”,人确实越来越难赢。机器不累,不尴尬,不拖延,还能同时开几十条线。
但一个错误问题,可以消耗掉一万个漂亮答案。
所以不能被替代的,可能不是某种固定技能。技能会被拆、会被学、会被自动化。我想,面对不确定的现实,愿意定义目标、给判断、做取舍、承担后果,才是普通打工人不会被替代的。
相比“怎么让AI多干活”,不如开工前多慢一分钟,让AI做的确实能对结果负责。
AI可以把东西抛得很快,但问题、取舍、证据和后果,总得有人接住。
最后落到日常里,其实就是几句普通话:
我们到底在解决谁的问题?
什么结果能证明做对了?
这次明确不做什么?
如果失败,怎么发现?
如果出事,谁负责?
欢迎大家交流下如何面对AI带来的就业冲击..
REFERENCES
· Harvard Business School / BCG:Navigating the Jagged Technological Frontier
· Science Advances:Generative AI enhances individual creativity but reduces the collective diversity of novel content
· Anthropic Economic Index
· NIST AI Risk Management Framework
CC4PM · Claude Code for Product Maker
Lesson 22.7 · 超级甲方