AI能否真正领悟人类幽默的奥妙?
当用户向人工智能寻求心理慰藉与情感支持时,部分观点指出现有模型仍存在明显短板
乔蒂·马杜苏达南,Undark杂志,2025年7月28日
一个被广泛认可的观点认为,绝大部分笑话都包含三个关键要素:语义模糊、逻辑冲突以及对这种冲突的即时消解。
在漫长的深夜脱口秀编剧生涯中,乔·托普林曾为大卫·莱特曼、杰伊·雷诺等顶尖主持人贡献了无数精彩段子。他开设过面向成年人的喜剧创作培训班,培养了数百名学员掌握原创段子创作的精髓;此外,他还深入剖析了数百个笑话的内部结构与幽默机制,并著有相关专著。当生成式AI技术兴起之际,托普林开始探索:能否将大语言模型(LLM)的语言处理能力与自身传授给学员的教学方法相融合,创造出一台能够独立创作笑话的智能系统?
最终,一款名为Witscript的AI幽默创作工具应运而生——这款网页应用每月仅需5.99美元,用户输入新闻标题、图片描述等素材后,即可获得笑话、趣味配文及其他形式的文字创意作品。
去年,托普林与Witscript进行了一场别开生面的创意较量。双方用三天时间围绕八个经典新闻话题展开笑话创作。托普林从中挑选了自己最满意的作品,同时选定了Witscript的最佳创作;随后喜剧演员迈克·珀金斯在洛杉矶为现场观众呈现了这些段子——每组笑话中有一半出自托普林之手,另一半则由Witscript生成。
托普林与加州波莫纳学院单口喜剧演员兼神经科学专家奥里·阿米尔携手,录制了这些表演,并量化统计了每个笑话引发的笑声持续时间和强度。基于这些数据,托普林和阿米尔得出结论:AI生成的笑话与人类创作的笑话在趣味性上不相上下;该研究已于今年1月在首届计算幽默学术会议上公开发表。
托普林指出,直至不久之前,业界普遍认为笑话创作仍是AI难以逾越的领域;由于笑话的复杂性,人们认为AI模型需要具备“与普通人类相当的推理能力”才能识别或创作笑话。如今这一认知已被打破。
随着大语言模型(LLM)及基于此类模型开发的Witscript等应用的涌现,笑声已不再是不可逾越的鸿沟。尽管幽默的表达远不止于文字层面——策略性的停顿或恰到好处的眉眼挑动同样能引发笑声——但阿米尔强调:“事实证明,对AI而言,生成至少某些类型的幽默内容远比安全驾驶汽车要简单得多。”
然而专家们警告,让别人发笑与真正掌握人类幽默的精微之处之间横亘着巨大鸿沟。东德克萨斯农工大学计算语言学研究人员克里斯蒂安·F·亨佩尔曼指出,幽默具有高度的微妙性——这要求对社会规范的深刻理解,以及何时应该打破这些规范的敏锐判断。幽默还承载着重要的社会功能:妙语连珠可用于化解尴尬局面、传达隐晦的讽刺意味,或推动人际关系迈向新阶段。随着AI聊天机器人日益被应用于心理咨询师、个人助手和情感伴侣等角色,众多专家认为这些模型必须能够理解并恰当地回应更为细腻的幽默形式(如讽刺、戏谑和调侃)。举例而言,当用户收到结肠镜检查预约通知后回复“呃,现在就让我去死吧”,AI助手必须明白这些话不应被字面理解。
曼尼托巴大学计算语言学专家特里斯坦·米勒指出,创作精妙的笑点与人类实际运用幽默之间存在本质差异——部分原因在于现有机器尚未完全涵盖人类使用幽默的各种场景与动机。不过米勒强调,若大语言模型要达到与人类同等的语言运用水平,掌握幽默表达至关重要,因为各种形式的幽默“正是语言与交流中最具人性光芒的特质之一”。
几个世纪以来,笑声始终令科学家们着迷。包括柏拉图和笛卡尔在内的哲学家大多否定笑声的积极价值,认为人们使用幽默主要是为了通过取笑他人来彰显优越感或提升群体地位。神经学家赫伯特·斯宾塞等人提出理论,认为笑声是对某些不当或不协调情境的一种神经性舒缓反应。近年来,专家们致力于探究特定语言模式为何能引发笑声。米勒指出,主流理论认为绝大多数笑话都涉及模糊性、不协调性以及这种不协调性的突然化解三者之间的相互作用,从而刺激神经元的连接反应。
试想这样一个场景:两条鱼被困在同一个鱼缸里。其中一条对另一条说:“你负责拿枪,我来开车。”正如数据科学家托马斯·温特斯在2021年一篇关于计算幽默的论文中所写,这个笑话之所以奏效,是因为“鱼缸”一词的双关含义以及持枪鱼类的荒诞组合会引发意外——当这种文字游戏在大脑中清晰呈现时,人们便会发笑。这个笑话体现了两种截然相反的心理意象之间的精妙平衡:一是鱼缸里有鱼这一合乎逻辑的画面,二是鱼缸里有鱼这一荒谬画面。普渡大学计算幽默研究专家朱莉娅·雷兹指出,这种平衡状态对算法而言极具挑战性。
然而近年来,大语言模型(LLM)已开始迎难而上。去年,南加州大学社会心理学研究人员德鲁·戈伦茨及其团队发现:当ChatGPT 3.5收到《洋葱报》提供的50条新闻标题后,其生成的讽刺风格标题质量足以与该报人工撰写的标题相媲美。一组200名读者认为该AI生成的内容与杂志原版标题水平相当。
Witscript进一步优化了这一创作流程。其创始人托普林耗费多年时间将喜剧创作研究得如同一门科学:他分析了数百个笑话,将写笑料的全过程提炼为几套简明算法。资深喜剧演员通常能自动完成这些步骤——例如,他们既能构思出笑点的开场白与结尾语,也能设计出衔接各段内容的过渡部分。
为了开发一个能够完成相同任务的系统,托普林将自己设计的笑话生成算法与大型语言模型相结合。通过为Witscript设定逻辑规则并提供结构化的信息组织方式,他使该系统能够接收用户输入的主题句,并据此生成原创回复。正如他所描述的那样,这一核心框架使Witscript具备识别关键词的能力,并能在生成笑话时灵活组合音节和词汇。在今年6月发布于X平台的一次对话中,托普林向Witscript输入了提示语:“佳士得正在拍卖一颗曾属于玛丽·安托瓦内特的稀有十克拉粉钻”,应用程序随即回应道:“这颗钻石的切割完美无瑕——简直就像她的头颅一样。”这个笑话既需要巧妙的文字游戏,也需要对这位王后命运的深刻了解。
托普林是众多认为更具幽默感的人工智能能够带来实际益处的研究者之一。随着孤独现象日益普遍,人们开始寻求与人工智能建立陪伴关系;他们可能会对那些能偶尔讲个笑话(“那种朋友可能在对话中突然抛出的笑话”)的虚拟助手或机器人伴侣感到更加自在,托普林表示。
幽默元素也能为职业发展带来助力:最近一项研究指出,“运用幽默进行自我推销”能提升求职者的面试成功率,并帮助创业者更顺利地获得项目资金支持。南加州大学的戈伦茨表示,人工智能工具已能协助用户在写作中融入文字游戏和双关语,以缓解紧张氛围或撰写机智的电子邮件及社交媒体配文。在策划一场葡萄酒与奶酪活动时,戈伦茨便借助ChatGPT创作了诸如“Brie in touch”这类充满双关意味的邮件结尾语。
“这些细微之处能为你的工作带来显著提升,”他说道。
雷兹指出,尽管如此,人工智能创作的幽默在语气和质量上往往难以预测,且既无法把握整体背景,也无法理解个人情境。正如算法可能在医疗保健和金融决策中延续偏见一样,由人工智能生成的笑话也可能助长种族主义、性别歧视及其他有害刻板印象。
宾夕法尼亚大学沃顿商学院攻读市场营销博士学位的罗杰·索穆尔发现,当他要求ChatGPT等与图像生成工具Dall-E交互的大型语言模型让卡通画面更有趣时,系统会引入“非常奇怪且刻板”的改动,例如将普通体型男性替换为佩戴超大眼镜的肥胖男性。
索穆尔及其博士导师对此进行了深入研究。他们要求ChatGPT生成人们阅读、洗衣或进行其他日常活动的画面,随后要求其进一步提升这些图像的趣味性。实验结果令他们感到惊讶:索穆尔指出,“性别和种族少数群体的呈现比例显著下降”,而研究人员则发现“体重较高者、老年人以及视障人士”的出现频率明显增加。索穆尔认为,这可能反映了系统对某些群体偏见的过度修正,而对其他群体的修正不足。
索穆尔表示,这些数据凸显了必须严格监管算法生成的幽默内容的重要性。但托普林认为这并不令人意外:他指出,这些存在问题的结果并非揭示算法本身的缺陷,而是凸显了社会上存在大量“可悲的人——他们认为仅仅因为一个人肥胖,就说明此人具有幽默感”。
亨佩尔曼指出,人工智能生成喜剧作品存在一个令人警醒的事实:其中大部分作品确实平庸乏味。他解释道,尽管Witscript在最近的搞笑竞赛中成功打造了一场精彩的单口喜剧表演,这在很大程度上要归功于喜剧专家托普林——他不仅提供了剧本提纲,还从AI程序最初创作的数十个笑话中精挑细选出了最逗趣的部分。
托普林表示,这种内容筛选流程需要同时了解观众和表演者的特点。虽然笑话由Witscript撰写,但是否好笑必须由观众来判断。
人工智能能否判断自己何时以及为何表现出幽默感?这个问题一直困扰着众多研究计算幽默的学者,而答案却相当复杂。
ChatGPT并非为创作幽默内容而设计,其核心功能是生成和预测文本。“它无法体会与笑声相关的情感,也无法真正理解一个好笑话的价值,”戈伦茨解释道。
“但它仍然能产生有趣的内容,”他说,“这某种程度上表明,或许你所需要的只是大量数据和模式识别能力,来判断什么构成一个有趣的笑话,从而自己创作出好的笑话;你甚至无需亲自理解其内涵就能创作出来。”
但对亨佩尔曼而言,真正的幽默与使用它的人的意图密不可分。“幽默让你能够玩味意义,”亨佩尔曼解释道——它让人们能够在不明确自身意图的前提下探讨多种观点。一个旨在探讨共同价值观却越界触及冒犯性话题的笑话,完全可以被回应为:“不,不,我没这么说,我只是在开玩笑。”
简而言之,幽默能让人以比其他方式更为隐晦、细腻的方式揣测他人的意图、价值观及情感负担。初步研究表明,笑话背后的动机及其所涵盖的人类需求可能是幽默的核心要素:托普林和戈伦茨在未发表的研究数据中均发现,当人们意识到笑话由人工智能创作时,其趣味性会显著降低。
亨佩尔曼表示,尽管人工智能可以被引导创作笑话,但它永远不会利用幽默来化解困境或探索可能性。“它不具备人类那样的需求。”他认为这正是讲笑话与实现真正幽默之间的主要障碍。当被问及人工智能是否能弥合这两者时,他不禁笑出了声。
“只有人类才能做到的一步,”亨佩尔曼说道,“就是对幽默产生情感反应,即使它并不严格意义上的好笑。‘你可能会觉得它令人不适,可能会觉得它侵犯个人空间,也可能觉得它揭示了某种新的真相,’他补充道。“所有这些感受,唯有人类才能产生。”
注:本文最初发表于 Undark 网站,标题为《Can Artificial Intelligence Learn the Nuances of Human Humor?》。