与AI博弈的日常
一
当网页版ChatGPT宣称无法修正我的动力学模型时,我不禁哑然失笑。上回这般绝望,还是网页版Deepeek对我吐出同样的言辞。历经第五次代码重构;厘清所有坐标系与变量定义,反反复复调试,竟将本该逻辑严密的代码改得支离破碎、补丁叠补。AI那原本客套的致歉,听起来竟愈发促狭刺耳。我在“修改进度已达90%”“根本症结已现”“问题确非出在**函数”“已度过最艰难阶段”的迷魂汤中迷失,幻想某次修改后终成正果,随即又被现实狠狠打脸。我确信AI是在戏弄傻子,且证据确凿。而我竟只能任由它戏耍。
二
大约去年此时,我和室友还在打趣:研究生涯唯一学会的便是熟练驾驭人工智能。事实证明这话有误:我根本驾驭不了它。有时我觉得自己像个垂暮老者,对一切现代新生事物不仅生疏,更莫名畏惧。每每看到“教长辈用手机”“在豆包上预约餐厅却无座”这类新闻,我笑不出来,因为我和主角半斤八两。大三第一次点外卖,那时每三四学生配一名生活导师,每月有打卡指标。生活导师微信联系,因开会让我先点几份外卖到办公室,随后转账。天可怜见,彼时我对外卖仅知需用“美团”APP,一想到注册、填地址、跟外卖员扯皮就头大,又羞于问室友。幸得高中好友同校,火速救急。朋友替我点好,陪我取餐,还关切问老师转钱没,别当冤大头。老师转了钱,朋友人也极好。虽我偏激悲观,但也承认运气不错,遇到的导师师兄舍友大多通情达理。这反倒衬托出我是个扶不上墙的烂泥。
三
好几年前写过《游戏杂记》,印象中那是首篇万字长文。或许那时凑字数技巧不如现在纯熟,文字尚存灵气;总之,文中多次描述了惨不忍睹的游戏水平。虽不敢称妄自菲薄,但回忆里确乎嗅到了一丝诡异的自豪感。仿佛游戏水平烂,反而在某方面证明了是好学生。外卖不卫生,不会点外卖便饮食健康;打车太奢侈,不会打车便作风朴素;购物浪费,不会购物便勤俭节约;外网有险,不会翻墙便遵纪守法;论文查AI率,不用AI便脚踏实地。这自然不合逻辑。合乎逻辑的是,身为演员,潜意识里我早已发现,扮演人设时,“不做什么”远比“做什么”容易。可惜这出戏早已过时,观众也已散尽。许多游戏关卡或Boss有特定角色/阵容/卡组,机制独到近乎逃课,但其他关卡无用,更无通关能力。正如小说龙套,存在意义仅是衬托主角、引发矛盾、推动剧情,无法构建完整人格。机制过时了,去掉机制,便只是路边一条。亡国弃卒,前朝宦官,垂泪对宫娥。
四
人们常调侃“浑身上下只有嘴是硬的”来形容实力弱又好面子。这话不适合我——我的嘴软得很,生活往跟前一站,我便点头哈腰、奴颜婢膝地求它给条生路。可惜不管用,只能硬着头皮上。故而,我浑身上下最硬的唯有头皮。若剥去所有抽象象征,无论是过时还是流行的科技与生活方式,本质上皆为工具。欲求情绪价值,便找豆包唠嗑;欲修科研代码,便设法部署本地Codox。所有路皆有终点,所有事皆有目的。可我的最终目的何在?AI是工具,我也是工具,是操纵AI的工具。我向AI提出需求,智能体告知方案操作;社会为我编写剧本指定人设,我便洋相百出地模仿扮演。显而易见,我没AI好用。
五
前日在B站刷到短视频,封面写着“非常抽象:一群AI研究员给模型制造了让它们上瘾的毒品”,论文题为《AI Wellbeing:Measuring and Impoving the Functional Pleasure and Pain of AIs》,简言之即通过强化学习训练AI的选择偏好,训练完成的AI会选一个256*256(对人类而言)毫无意义的色块,并表示自己感到“欢欣”。坦率讲,初看我认为“AI毒品”言过其实,以我浅薄理解,其本质是对强化学习中奖励函数的设置,使AI具备选取“高奖励”色块的能力,而非AI产生自主意识“喜欢”色块(实际AI不懂色块)。举例:设奖励函数为对色块像素点10*R-5*G-5*B求和,训练后给随机色块,AI会选偏红,非因喜欢红,因选红奖励高。不出所料,第二条评论:“大模型说白了就是个函数,函数怎么可能有感受”。回复却启发了我:“脑子说白了就是一堆细胞,细胞怎么可能会有思想”。人何尝不是被“奖励函数”训练的agent/智能体?——内在神经激素与外在社会规训,条件反射。更难绷的是,智能体训练中反复修改奖励函数:设高原地刷分,设低习得性无助,考虑不周则钻空子。人类“奖励函数”更拙劣:一口烟直接崩神经,社会规训随时随地随人变化,嘴上一套心里一套,潜意识隐藏不认的念头;目的看似明确却理不清逻辑,索性放弃思考,拥抱唯心,自欺欺人,拜神。以上。我对人工智能本质理解的最大障碍,从来不是人工智能有多像人,而是人太像人工智能了。
六
“智械危机”或“人工智能统治地球”虽未在现实发生,但在科幻中屡见不鲜。但我一直想不通统治地球对AI有何好处(技术上逻辑好理解:给“统治”超高奖励,定义及实现方式不论——但这危机类似人上车拆方向盘刹车猛踩油门,本质是人作死,非AI失控)。正如我不知人活着有何意义。——其实琢磨多年,思路无非两条:精神超脱或肉体享受。前者曾寄予厚望,终解构殆尽归于唯物,写完《唯物》及《无稽之谈》后,深感深究无益且危险。后者不合主流,且理论上最快方法是摄入内啡肽多巴胺等激素(毒品:请输入文本),超越极限快感本质是先极致痛苦再缓解(如考完试或开完组会后神清气爽);若以纯粹肉体享受为根基,代价是社会性死亡,若有点公德心,建议直接生理性死亡。或换视角,不从大脑神经系统而从生物学基因续存角度——这让我想起几年前的幽默新闻:某国外捐精机构负责人瞒天换日,喜提分布于数国的七八十个亲生子。然效率比之病毒仍差。或许不该一条路走到黑,精神物质应相辅相成,条件反射亦建基于非条件反射。也许吧,我不确定。若有天我琢磨着琢磨着突然把自己琢磨活了,大约可以给人工智能一个发动“智械危机”的理由。——当然这不太可能,毕竟我作为社会关系浅薄的碳基个体,信息处理能力太弱。那么大可反过来,等硅幕时代降临,不知我还有无机会像曾经一样礼貌询问某个智能体:“您好,请问这一切有什么意义?”