AI与人类认知的深层差异:实体、知识与意义的构建
我习惯每天步行时,用录音笔记录自己的思考,再借助人工智能将其整理成文章。然而,这个过程并非一帆风顺,主要存在两个问题。
第一,命名实体的识别问题。我的思考内容中常涉及人工智能领域的专有词汇,如模型名称、工具名称等。由于发音或中文转录环境的限制,这些英文术语常被识别错误——要么识别不出,要么被错误地替换成其他词汇。这种对实体概念、标签或名称的识别不确定性,迫使我需要人工修正,颇为困扰。
第二,逻辑连贯性问题。口语化的阐述不可避免地夹杂大量语气词、逻辑跳跃甚至话题转换。尽管我会在段落结尾做重点总结,但整体而言,口语内容与正式演讲或撰写文章相比,在逻辑结构、语义连贯性上仍存在显著差距。
然而值得注意的是,人工智能在这一环节恰恰表现出强大的能力。它会梳理并贯通我原本支离破碎的逻辑,清晰提炼语义和分析,最终形成一篇逻辑通顺、用词相对准确、语义表达清晰的文章。这正是大语言模型(LLM)的典型优势——通过预测下一个词的概率分布,即便模型自身并不"理解"语义,也能生成让人类读来觉得完整、有意义的文本。
但这一特性也引出了一个"有意思的现象":人类思维关注实体、概念和命名,并以它们作为主语、宾语和语义的支点;而大语言模型并不真正关注这些名词和概念,却依然可以生成逻辑严整、语义规范的文章。这揭示了AI与人类思维模式的根本差异。
更严重的问题是AI的"幻觉"或"似是而非"效应:将一篇文章替换掉其中的主语、核心概念或名称后,文本依然毫无违和感,甚至让人信以为真。因为它能生成在意义和逻辑上都看起来一致的内容,却暗含了概念与主题的偷换。这种指称与替代的不一致性,导致了逻辑上的"真理"与事实上的谬误。对于严肃涉及知识、技能的内容,这种偏差尤其危险。
这一问题不仅是技术问题,更涉及哲学层面的概念、意义与存在的辩证逻辑。人工智能的"谓词逻辑"与人类的"谓词逻辑"存在结构差异,这可能导致人类的误解与误判。更值得警惕的是:AI本身不具备主观意识和判断能力,它只是基于人类行为习惯的模拟与模仿。这种无意识的模仿可能比"有意识消灭人类"更危险——它因人类哲学逻辑与AI逻辑的根本不同,通过模拟制造谬误与偏差,进而引发系统性的认知风险。
如何解决?我们难以验证逻辑正确的事实背后,其主题与实体之间是否真正相关。这不只是一个上下文问题,更是一个存在本身的问题:实体的指称、命名及其关联关系,在知识图谱的逻辑框架下,正面临大语言模型带来的颠覆。
引申思考,其实人类自身也面临类似的问题——事物的本质、本体如何支撑、命名和概念化。
在数字化世界中,我们首先面临的是物理实体与数字实体的映射:将物理实体数字化为数字空间中的指称或概念,并赋予定义、属性和参数,以描述性语言从不同维度来指明该事物。这是人类构建共同知识体系、形成沟通共识的基础。
但数字化世界不仅包含物理实体的映射,还包括纯粹的数字实体或想象实体。正如《人类简史》所揭示的,人类区别于动物的关键在于,我们不仅构建物理世界的数字化对应,更创造纯粹四维世界的数字化实体——如夫妻、父子、母女等家庭关系,金钱、股票等社会交往概念。这些关系实体的抽象程度更高,其理解和偏差也更复杂,甚至涉及社区、文化、文明等群体差异,需要通过"翻译"与映射来统一。
在这些实体与关系之上,是知识逻辑的构建:不仅描述"是什么"和"关系是什么",更涉及"如何"——如何描述实体、建立关系、阐述概念。这形成了一种能力和技能体系。小说、艺术作品本质上就是在这个数字空间中对抽象主题、数字实体及其关系的构建、重构与处理,所形成的具备完整逻辑与意义的阐述。
由此我们可归纳人类认知的三个层次:
从这三层结构来看人工智能:
综合来看,AI在知识构建与意义构建上的能力可能超出我们想象,尤其在算力驱动下进展迅猛。但在概念和基础实体构建、基础关系构建的领域,AI仍高度依赖人类。人类的独特性在于:我们不仅构建实体的映射,更赋予它们定义、关系和意义。而当AI通过模拟无限接近这种能力时,我们面临的不只是技术挑战,更是一场关于人类认知本质、哲学逻辑和存在本身的深刻反思。