Agent能否成为AI的终极形态?
人工智能领域(更准确地说是大语言模型领域)每日都涌现大量资讯、新产品和排行榜,术语更是五花八门:提示词工程、上下文工程、智能体(Agent)、数字分身、龙虾、Agent团队、自我进化的AI、人机协同、超级智能体……跟不上节奏完全情有可原,连语文老师恐怕都力不从心。
人工智能助手 AI Agent|你打算让"龙虾"掌控你的哪些事务?
今天我想探讨的核心问题是:AI Agent 是否已经代表了最高水准?
先给出我的观察结论:目前来看确实如此,也就是说它尚未具备所谓的主体性——这个近期的热门词汇。所谓的Agent不过是被赋予的假想化人格身份,用于实现"分身"功能。
当然,如果答案是否定的,也未尝不可展开想象……那就需要另起篇幅了。
我们不妨从对话式AI(chatbot,专注于回答各类问题)谈起,在Agent时代(强调执行能力)聊这个似乎已不够新潮,但它仍是普罗大众生活中最熟悉、最亲近的AI形态。
让全网焦虑的"龙虾"究竟是什么?|AI时代的事实与观点
通过近期与AI的交互,我注意到,无论哪个AI(模型各异、知识储备不同,展现出不同面向和背景,但依然缺乏那个叫作"主体性"的特质),当我们寻求其协助时(无论大事小事都咨询AI),提示词和提问中的主体性引导依然至关重要。原因在于AI目前尚不具备主体性,或者说其"主体性"必须由人类来赋予。
ChatGPT Image 2.0与Gemini的Banana谁更出色|与AI共存体验No 2
即便你声称想要"客观"的回答或评价,它恐怕也并非真正理解"客观"的含义,因为它的能力之一便是揣摩你的意图,根据所理解的你的需求来提供答案。
一旦脱离你赋予的身份,它只能采用默认被赋予的身份,从你输入的每个token中、从它被LLM赋予的基于"流水线工人"、"某国普通人"、"某高校博士生"、"某领域资深专家"的身份中提取认知和观点。
说真的,Token词元的"元"到底是什么单位?|杞人忧天
因此要警惕你让它说的"客观",你的一个措辞、甚至语气词,都会体现(暴露)你的立场。语气为何如此关键?Gemini的Notebook LM就提供了指定回复语气的选项。
举个例子(不列举具体案例,懂行的人或许能猜到),假如你让它调研某"成果"、"学术"内容,它必定会将结果往"高大上"方向靠拢,也会把各种溢美之词都用上,全然不顾是否真的符合"专家"标准,难怪电视上的"专家"那么容易令人信服。
然而反过来提问,就是告诉它我要批判这些"成果",它同样可以满足你,而且同样有理有据——这跟早期AI的"幻觉"现象完全不同!
那么,没有火眼金睛的我们该相信哪个回答、采纳哪个观点?难道还要找个AI来当裁判?作为出题人的我们理应拥有裁决权。那么我们还能依赖AI吗?正如"辩论赛"从来不是争对错一样,AI给你的看似有观点,实则没有立场。
如果要细致检验其客观性,真的需要"show me the code"!(可以是vibe coding生成的,但最好不是那种离开大公司大模型就无法运行的代码,当然依赖大模型的代码也有其价值),这样至少你可以审查它的code是否符合你认可的"客观"标准。
当然,前提是你真正拥有定义问题的主体性,拥有审查这个code的经验、能力和资格(完全的vibe coder可能无法审查code,但至少可以有一个承担code reviewer角色的Agent),以及你对预期结果的清晰判断力。
结合昨天引导其发表评论的体验,对于AI目前所缺失的(与人的根本区别),我认为至少有以下两点:
🔺(1)主体性(就是近年来流行的这个词)。
首先包括价值判断,即"好不好"的问题。这实际上完全取决于"主语"是谁,"主语"的立场在哪里(何时何地何种处境)。作为AI,它目前没有"身份",它依赖你给它假定、赋予一个身份和立场,它基于该身份"见什么人说什么话"。
其次,同样重要的是,还包括对其所言负责,这也是基于模拟人类社会"身份"的。它可以充当(此时此刻、随着"对话框"关闭而结束的,也可能是长期的——你有时可能希望如此)你的"军师"、"小抄"、备忘录、提词器、导师、引路人、代言人、管家、秘书、仆从……,但没有一个人会把它等同于真正拥有人类"身份"的你自身。
你选择什么样的回答完全取决于你的引导、驾驭并且承担后果。这当然