Agent能否成为AI的终极形态？

发布时间：2026-05-31 15:47阅读：35

人工智能领域（更准确地说是大语言模型领域）每日都涌现大量资讯、新产品和排行榜，术语更是五花八门：提示词工程、上下文工程、智能体（Agent）、数字分身、龙虾、Agent团队、自我进化的AI、人机协同、超级智能体……跟不上节奏完全情有可原，连语文老师恐怕都力不从心。

人工智能助手 AI Agent｜你打算让"龙虾"掌控你的哪些事务？

今天我想探讨的核心问题是：AI Agent 是否已经代表了最高水准？

先给出我的观察结论：目前来看确实如此，也就是说它尚未具备所谓的主体性——这个近期的热门词汇。所谓的Agent不过是被赋予的假想化人格身份，用于实现"分身"功能。

当然，如果答案是否定的，也未尝不可展开想象……那就需要另起篇幅了。

我们不妨从对话式AI（chatbot，专注于回答各类问题）谈起，在Agent时代（强调执行能力）聊这个似乎已不够新潮，但它仍是普罗大众生活中最熟悉、最亲近的AI形态。

让全网焦虑的"龙虾"究竟是什么？｜AI时代的事实与观点

通过近期与AI的交互，我注意到，无论哪个AI（模型各异、知识储备不同，展现出不同面向和背景，但依然缺乏那个叫作"主体性"的特质），当我们寻求其协助时（无论大事小事都咨询AI），提示词和提问中的主体性引导依然至关重要。原因在于AI目前尚不具备主体性，或者说其"主体性"必须由人类来赋予。

ChatGPT Image 2.0与Gemini的Banana谁更出色｜与AI共存体验No 2

即便你声称想要"客观"的回答或评价，它恐怕也并非真正理解"客观"的含义，因为它的能力之一便是揣摩你的意图，根据所理解的你的需求来提供答案。

一旦脱离你赋予的身份，它只能采用默认被赋予的身份，从你输入的每个token中、从它被LLM赋予的基于"流水线工人"、"某国普通人"、"某高校博士生"、"某领域资深专家"的身份中提取认知和观点。

说真的，Token词元的"元"到底是什么单位？｜杞人忧天

因此要警惕你让它说的"客观"，你的一个措辞、甚至语气词，都会体现（暴露）你的立场。语气为何如此关键？Gemini的Notebook LM就提供了指定回复语气的选项。

举个例子（不列举具体案例，懂行的人或许能猜到），假如你让它调研某"成果"、"学术"内容，它必定会将结果往"高大上"方向靠拢，也会把各种溢美之词都用上，全然不顾是否真的符合"专家"标准，难怪电视上的"专家"那么容易令人信服。

然而反过来提问，就是告诉它我要批判这些"成果"，它同样可以满足你，而且同样有理有据——这跟早期AI的"幻觉"现象完全不同！

那么，没有火眼金睛的我们该相信哪个回答、采纳哪个观点？难道还要找个AI来当裁判？作为出题人的我们理应拥有裁决权。那么我们还能依赖AI吗？正如"辩论赛"从来不是争对错一样，AI给你的看似有观点，实则没有立场。

如果要细致检验其客观性，真的需要"show me the code"！（可以是vibe coding生成的，但最好不是那种离开大公司大模型就无法运行的代码，当然依赖大模型的代码也有其价值），这样至少你可以审查它的code是否符合你认可的"客观"标准。

当然，前提是你真正拥有定义问题的主体性，拥有审查这个code的经验、能力和资格（完全的vibe coder可能无法审查code，但至少可以有一个承担code reviewer角色的Agent），以及你对预期结果的清晰判断力。

结合昨天引导其发表评论的体验，对于AI目前所缺失的（与人的根本区别），我认为至少有以下两点：

🔺（1）主体性（就是近年来流行的这个词）。

首先包括价值判断，即"好不好"的问题。这实际上完全取决于"主语"是谁，"主语"的立场在哪里（何时何地何种处境）。作为AI，它目前没有"身份"，它依赖你给它假定、赋予一个身份和立场，它基于该身份"见什么人说什么话"。

其次，同样重要的是，还包括对其所言负责，这也是基于模拟人类社会"身份"的。它可以充当（此时此刻、随着"对话框"关闭而结束的，也可能是长期的——你有时可能希望如此）你的"军师"、"小抄"、备忘录、提词器、导师、引路人、代言人、管家、秘书、仆从……，但没有一个人会把它等同于真正拥有人类"身份"的你自身。

你选择什么样的回答完全取决于你的引导、驾驭并且承担后果。这当然

← 上一篇：人机对话录：智能革命重塑文明下一篇：首次创业折戟后重新起航，她帮助中国AI企业开拓海外市场实现千万业绩 →