大模型与智能体的核心局限及关键应对
大模型存在三个根本性局限:
①产生幻觉
②知识存在截止点
③缺乏个性化认知。
大模型仅包含训练数据,缺少用户个人数据。
模型无法辨别「已知信息」与「推测内容」,当面对训练数据中未涵盖的事实时,只能进行预测——这等同于虚构。真正的解决方案是向其提供准确数据(例如RAG)。
上下文窗口再大也是单次有效,每次开启新对话便会重置。
大模型本身不具备记忆功能。
当大模型表现不佳时,首要任务是补充数据,而非更换模型。
人工智能的能力上限=数据质量×模型能力+流程编排。
智能体
不仅能理解与生成语言,还拥有感知环境、制定决策并执行行动的能力。
智能体的本质:感知->推理->行动,这是一个以LLM为核心大脑的自主系统。
智能体核心=数据×LLM
大语言模型
基于巨量文本数据训练而成,能够理解并生成自然语言,在文本创作、问答系统等领域展现出卓越能力。
ReAct=推理+行动
推理与行动的循环过程
ReAct架构因其高度灵活性、适用于开放性任务,已成为行业内应用最广泛的模式。
检索增强生成
一种融合信息检索与文本生成的技术。在回答问题前,先让模型查询相关知识库,然后基于这些真实材料进行回答。
索引、检索、生成
使智能体学会“查阅资料”,实现对知识数据的检索。
模型上下文协议
一种标准化的通信协议,定义了大模型与外部工具之间交互的规则。
人工智能工具生态的“通用接口”,实现数据接入的标准化。
技能:将专业经验转化为数据,实现经验数据的结构化。
记忆:个性化数据的存储与召回。
语义记忆,情景记忆,工作记忆。
总结:RAG负责知识数据的检索,MCP实现数据接入的标准化,Skill完成经验数据的结构化,Memory处理数据的积累与召回。模型决定了智能体“思考的深度”,而数据决定了智能体“执行的效果”。
人工智能领域的经典原则“输入垃圾,输出垃圾”意指:若输入数据质量低劣,则输出结果必然不可靠。