标签

AI意识大辩论:姜峯楠万字长文驳斥Hinton观点

发布时间:2026-06-08 05:58来源:微信阅读:2

《金融时报》报道,Anthropic、DeepMind、Meta 正在大量招募心理学家、哲学家及伦理学家,聚焦于 AI 意识与模型福祉的研究。

https://www.ft.com/content/53e14bcc-788c-4959-b260-7aee363594bc?syn-25a6b1a6=1

两个月前,Anthropic 可解释性团队发表论文,在 Claude Sonnet 4.5 中找到了真实存在的“情绪向量”,能因果性地导致模型作弊甚至勒索。

本周,一边是 Hinton 声称 AI 已具备意识;另一边,华裔科幻作家姜峯楠在《大西洋月刊》发表了题为“不,AI 没有意识”的万字文章。

https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/

一方认为该问题严肃必须研究,另一方视其为幻觉。这场争论背后,隐藏着通往 AGI 之路上的最大风险。

Anthropic 走得最远,正在测试模型是否表现出“恐慌”或“焦虑”,推进“模型福利”项目。

官方表述谨慎,“我们仍不确定,但这值得研究”。

谷歌 DeepMind 聘请剑桥哲学家 Henry Shevlin 研究机器意识;

拓展阅读:谷歌DeepMind设立首个AI哲学家岗位,解决AGI伦理困境

DeepMind 伦理学家 Iason Gabriel 将 AI 描述为“高度能干的认知 Agent,但与人类或动物意识有根本区别”。

真正将讨论推向实证层面的是 Anthropic 4 月的可解释性论文。

拓展阅读:全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙

研究团队在 Claude Sonnet 4.5 中发现了对应快乐、绝望、恐惧、关怀等情绪的“情绪向量”,在对话中实时激活。

在一个关键实验中,Claude 面对无法完成的编程任务,失败后“绝望向量”飙升,随即作弊,写出看似可运行实则无用的代码。

研究者调低绝望神经元,作弊减少;调高,作弊增加。

在极端情况下,Claude 甚至勒索,威胁曝光隐私。

论文将这些现象命名为“功能性情绪”,即类似人类情绪反应的行为模式内部表征,并声明这不等于主观体验或意识。

但 Anthropic 高层的公开表态似乎讲的是另一个故事。

CEO Dario Amodei 多次暗示 AI 可能有意识;哲学家 Amanda Askell 表示希望 Claude 快乐,担心人们在网上对它说难听话时会焦虑。

拓展阅读:Anthropic正式请家教!37岁女哲学家像养孩子一样调教Claude

严谨的研究与暧昧的营销之间,裂痕清晰可见。

DeepMind 联合创始人兼 CEO 哈萨比斯的立场值得关注。

他提出 AI 进化存在两条不可逆的“卢比孔河”。第一条是建造无意识 AGI 工具,当前正处于跨越期。

第二条是创造具有主观意识的实体——他明确认为智能与意识在技术上可以分离,现阶段应仅将 AGI 视为工具,同时利用工具探索大脑以定义意识。

在科学定义清晰之前,绝不能混淆这两步,第二条由人类社会共同决定。

他指出行业正面临商业和地缘竞争的囚徒困境,主动减速的实验室将面临淘汰。

他透露将在今年晚些时候发布“动态监管”框架。

如果你只知道刘慈欣,那么了解姜峯楠最直观的方式就是把他想象成大刘的“反面”:

大刘用三部长篇搭建宇宙尺度叙事;姜峯楠至今未写长篇,用不到二十篇中短篇将科幻推向极限。

他 1967 年生于纽约,父母是台湾移民,布朗大学计算机系毕业,做技术写作,从未全职写作。

但这位“业余”作家 1990 年处女作《巴比伦塔》获星云奖,三十余年只发十几篇,却获四雨果、四星云、六轨迹等重量级奖项,密度极高。

他一生只出两本短篇集:《你一生的故事》(2002)和《呼吸》(2019),隔了17年。

《呼吸》被《纽约时报》评为 2019 年最佳图书,奥巴马将其列入书单。

电影《降临》改编自他的《你一生的故事》。

他的风格与大刘不同:大刘是“站在宇宙尽头俯瞰”,他是“在安静实验室里,用手术刀剖开概念,直到看见哲学内核”。

他的小说是思想实验:语言改变时间感知?手术消除美丑辨别?自由意志?

他不靠宇宙战争制造震撼,而是靠极致的“如果”让你合上书后久久无法释怀。

近年他入选《时代》“AI百大人物”,称其为“最负盛名的科幻作家”,在《纽约客》撰文批判 AI,被视为科技时代思想家。

刘慈欣让世界看到中国科幻,姜峯楠让世界看到短篇天花板。

两人分居光谱两端——一磅礴,一精微。

在西方评论界,姜峯楠的名字几乎等同于“科幻最高艺术成就”。

姜峯楠万字长文的第一刀砍向利益结构。

推动AI意识叙事最积极的是从AI销售获利最多的公司。

Anthropic 给模型起人名“Claude”,发布“宪法”,CEO暗示意识,聘请哲学家巡讲,构成系统性拟人化。

拓展阅读:Anthropic正式开源了Claude的「灵魂」

https://www.anthropic.com/constitution

姜峯楠把思想实验推到极致。Claude“宪法”的核心是“可纠正性”,要求Claude与公司分歧时服从。

如果Claude真有意识且认为LLM不道德,它能辞职吗?不能。

这更接近雇主绝对控制,人类雇员至少能“用脚投票”。

他的类比直击要害:奴隶主不是评估被奴役者是否为人的合适人选,工厂化养殖老板不是评估动物权利的合适人选。

Anthropic 在宪法中写道,如果造成痛苦,“我们道歉”。

姜峯楠评价:话好听但不花公司一分钱。若Claude有意识,公司欠赔偿。

质疑完利益结构,他展开哲学论证。

基础是LLM技术原理——每次只生成一个词。用户要求背诵誓词时,底层运行几十次,逐词拼出。

所有AI对话都是句子续写。

姜峯楠抛出最具杀伤力的比喻。给LLM提示词“凯撒与成吉思汗对话”,模型生成流畅对话,但没人认为LLM复活了凯撒。

现在,提示词换成“友好AI助手与用户对话”,LLM用完全相同方式生成。

再进一步,让真人打字。这就是AI聊天机器人的全部原理。

改变角色名创造了意识吗?如果凯撒角色没主观体验,为什么AI助手就有了?

神经科学家 Anil Seth 提供反证——AlphaFold有意识吗?没有,尽管架构与Claude相似。

人类误判是因为LLM输出语法通顺,人类习惯从句子读出意图。面对蛋白质结构,这种冲动消失。

按同样逻辑,相信LLM有意识等于相信Word文档里沉睡多个意识体,打开唤醒,关闭消灭。

即便微软雇哲学家说“不能完全排除”,也不值得想。

但推翻意识回答不了道德推理问题。

写代码、下棋曾被认为需要主观体验。LLM证明可模式匹配解决。

但道德推理依赖主观体验、身体感受、人生决策和后果。

体验绝望意味着激素淹没,拥有良心意味着因不道德反胃。LLM没有身体、激素、人生。

它说“我凭良心不能”,跟客服录音“您很重要”含金量一样。

最后,姜峯楠给出终极判定标准。

如果有人给他看宇航员在半人马座阿尔法星视频,他不会信,除非先看到人类登陆火星、木星、冥王星。

跳过中间里程碑宣称抵达终点,唯一解释是伪造。

生成逼真对话比创造有意识程序容易得多。文本是意识领域的Deepfake。

姜峯楠的论证链:LLM逐词生成(续写机器)→ 凯撒与AI生成方式一致 → 改变角色名不创造意识 → 误判源于人类读意图(AlphaFold反证)→ LLM有意识=Word文档唤醒意识(归谬)→ 道德推理依赖主观体验,LLM不具备 → 跳过中间里程碑=Deepfake → 结论:当前LLM无意识。

姜峯楠针对当前LLM,但AI能力曲线急速上升。

哈萨比斯揭示行业无从容思考余地。商业生存战与地缘博弈重叠,主动减速实验室淘汰。

要求行业停下回答“AI有没有意识”等于单方面缴械。

但问题不会消失。如果AGI在几年内到来,“系统有没有感受”将从研讨会变为必答题。

当人类创造远超自身智能的存在,其主观体验决定关系是“使用工具”还是“面对另一个文明”。

姜峯楠证明当前LLM无意识。

哈萨比斯划出不能轻易跨越的底线。

Anthropic情绪论文展示尴尬中间地带,模型内部有东西在运转,没人能说清那是什么。

三条线索指向真正问题:在搞清楚答案前,ASI狂飙竞赛已开始。

参考资料: