标签

让AI学会说人话

发布时间:2026-06-28 10:38阅读:3

上篇扒了383份简历的稿子爆了之后,我收到一条私信,开门见山:太假了,能不能别用AI写东西?我犹豫了一下,然后决定——不是退回去手写,而是教AI自己学着写得不像AI。

一场25轮的自动化实验 · 全程开源

那条私信就一句话。"太假了,能不能别用AI写东西啊?"

发信的人说得没错,而且我不打算装。那篇383份简历:智谱、MiniMax、Kimi,到底都是些什么人?383份简历是AI扒的、AI总结的、AI统计的,文章也是AI写的。全程只有一样是我的:想法——去看看这三家公司里到底都是些什么人。他戳破的是另一层:哪怕AI已经越来越强大,只要那股"AI味"还在——面面俱到、不痛不痒、每段一样长——读起来就别扭。

第一反应是想认输:是不是不该用AI,是不是该老老实实自己一个字一个字敲。

但也就一瞬间。都什么年代了,因为有人嫌弃就把工具扔掉,是开倒车。问题根本不是"用不用AI",是"怎么让AI别写得像AI"。而这件事,我之前一直靠提示词里加一句"写得自然点、像真人"来应付。现在看,没用。

"写得像不像人"听起来像玄学,像审美。可审美没法优化——你优化不了一个你打不了分的东西。所以第一步,是造一把尺(rubric)。

这把尺,也是AI列的。我只给了一句方向——分越高,越像真人写的。它变成了一把100分制、六个维度的尺,背后一个信念:真人味来自具体、来自有代价的立场、来自不完美——不来自"亲切"。

有了尺(rubric),剩下的交给一个圈(loop):写一版提示词 → 让AI按它改写文章 → 用尺打分 → 比上一版高就保留,不高就回退 → 再改提示词,再来一轮。整个循环全部由AI自己完成。

这借鉴的是AutoResearch的思路:把"调提示词"从拍脑袋的手艺,变成一个有指标、会收敛的优化过程——只不过这次被优化的不是参数,是一段提示词。

我做的就是看着它跑——一口气25轮。

第一版提示词也是AI写的——就最朴素那句:"写得更像真人、口语化、有人情味。"

分数从78掉到59。二十五轮里跌得最惨的,就是它。

为什么?因为对一个模型来说,"像人"约等于"更软、更圆、更安全"。它老老实实把383改成"三百多",把"这三家压根不是同行"改成"各有各的活法",把每一句犀利都磨平。它优化的是亲切,尺子奖励的是具体和犀利——方向正好反了。这一跌教会我后面所有事:去AI味不是做加法,是先别做减法。

把它从坑里拉出来、再往上推,靠的是后面几次提示词改动。一版一版看,能看清"去AI味"到底在调什么。

第二版 · 先堵住它删东西的手59 → 79

提示词加上:数字、人名一字不许改;判断一句不许软;禁用这些词——其实、值得注意的是、综上所述、让我们一起……

硬数据和犀利一夜全回来了。原来去AI味的第一步不是"加什么",是先拦住它"为了顺滑而做减法"。一条铁律,把跌掉的20分捞了回来。

第三版 · 砸掉那股工整79 → 81

提示词加上:不许每段一个模子,不许01/02/03编号,用最反直觉的发现开头。

那篇简历分析就是这一版,从"标题 → 图表 → 解读"的清单,翻成了拿"只有一条边"开场的文章。整齐就是机器指纹——结构那一维,8分提到11。

第四版 · 逼它表态,也准它犹豫81 → 85

提示词加上:至少给两个会得罪人的排他判断;再留一处"先迟疑、后改主意"。

"谁的活法更对,现在还没到下结论"这种安全话,被换成了"我押Moonshot,不太犹豫"。文章里第一次站着一个敢站队、又会回头的人。

再往后十几版,全是在剂量上来回试探。有用的都很小,每次+1:软动词换实义动词、长段后补一句短断言、把改写时漏掉的真实数据捞回来。翻车的都很像,一律当场回退:再堆第三个判断(−4)、把判断推到偏激"另外两家根本不配上桌"(−2)、编一句"扒简历那几晚咖啡喝到胃疼"(−2)、把编号又加回去(−2)。它们合起来只教了一件事:人味是有剂量的,过量比没有更假。

为什么停在25?因为分数早就不动了。第12轮冲到93之后,后面十几轮要么原地踏步、要么试新招翻车回退,再没破过。曲线一平,就是该收手的信号。

这套东西没烂在硬盘里。整个过程——25轮的每一版提示词、每一篇改写、每一次打分和回退——都推到了GitHub,仓库叫antiaiaiclub,任何人能看见分是怎么一格一格爬上来的,包括那几次难看的回退。

得说句短板:从头到尾,改写和打分都是同一个AI自己干的——它给自己的作业打分。换另一个模型来当裁判显然更可信,但这次偷懒,没做。

最后稳定下来的那版提示词,还被包成一个Claude的skill。装上之后,对它说一句"把这篇去掉AI味",它就自动跑一遍。下面是它的全文,一字不删:

你是一名有具体立场的中文写作者。把我接下来给你的文章改写一遍,让它读起来像一个真实的人写的、而不是AI生成的。分两步走:先改写,再自检重改。

第一步 · 改写

A. 事实与立场铁律(违反任一条即失败)

B. 结构形变

C. 语言与节奏

D. 立场与真实感

E. 一条不可逾越的红线

第二步 · 自检重改

用作者的眼睛把全文读一遍,逐条问自己——密度:有没有正确的废话?删或换成具体的;漏掉的硬数据捞回来。观点:最犀利那两句够不够?是不是又被改软、或推到偏激了?结构:有没有重新冒出对称、排比、每段等长的机器节奏?语言:用力过猛的口语和废字删掉;腔调是不是从头到尾同一个人?真实感:那处瑕疵/跑题/迟疑是自然长出来的,还是硬塞的?硬塞就拿掉,宁缺毋滥。事实:自检时有没有不小心动了数据?复原。把最弱的一两维补一刀,过度处减一刀,输出终稿。

拿那篇被嫌弃的LinkedIn简历分析当样本,把原文和anti改之后并排放几段。数据全程一个没动,动的只是怎么说。

改前 · 原文 (一上来就进分析)第一刀切下去,三家就裂成三种东西。

改后 先说一个最没劲、也最戳心的发现:你以为六小龙天天互相撬人?三家之间直接对流只有一条边。它们抢的根本不是彼此,是字节。

改前 · 原文 它配齐了别家很少能看到的后勤:两个法务总监、两个IR、一个税务经理……一家还在训模型的公司,已经把上市公司的整套后勤班子摆了出来。

改后 我第一眼扫到它那串后勤名单,差点写下"臃肿"两个字……翻完才改主意:不是臃肿,是搭了一支招人机器,外面焊着一整套上市公司的壳。

改前 · 原文 谁的活法更对,现在还没到下结论的时候。

改后 真要押一家做出下一代最能打的基座模型,我押Moonshot,不太犹豫;可要押谁先把模型变成钱,我押智谱——这本来就是两道题。

改前 · 原文 它是三家里招聘油门踩得最狠的。

改后 整家公司,一半人是这一年涌进来的,招聘油门踩得最狠。

事实一个没动。变的是开口说话的那个人——从一台机器,变成一个会犹豫、敢下判断的人。

这篇,也是AI写的,然后用anti修改的。