AI入门指南:10个必须掌握的AI核心概念详解
使用AI工具时,你是否经常被各种专业术语困扰?
“需要优化一下Token消耗”
“建议用RAG方案,比微调成本低”
“上下文长度不够了,要拆成多轮对话”
每个字都认识,组合在一起却像天书一样。
别担心。这篇文章用通俗易懂的方式,帮你理解10个最高频的AI概念。
通俗解释:就是你跟AI说的话。但“提示词”特别强调结构化、有技巧的表达方式。
举个例子:
❌ 普通提问(发给文心一言):
“帮我写个周报”
✅ 提示词工程(发给文心一言):
“你是一位资深项目经理。请根据以下信息,用Markdown格式写一份周报,包含:本周完成事项(用列表)、下周计划(用表格)、遇到的风险(加粗标红)。要求语言简洁,不超过500字。”
后者就是提示词工程——通过角色设定、格式要求、约束条件,让AI输出质量翻倍。
官方定义:大语言模型处理文本时的最小单位。
通俗解释:就是AI数钱的方式。你发给AI的字 + AI回你的字 = 总Token数。
计算规则:
- 英文:1个单词 ≈ 1.3个Token
- 中文:1个汉字 ≈ 1个Token
- 标点符号、空格也算Token
为什么重要:
1. 直接决定你花多少钱(API按Token计费)
2. 决定AI一次能“看”多长的内容
国内各模型的上下文上限对比:
文心一言4.0:约2万字
通义千问Max:约2万字
Kimi:200万字(目前国产最长)
讯飞星火:约1.6万字
豆包:约1万字
一句话记住:Token就是AI世界的“字数”,但比字数更精细。
官方定义:当前对话中AI能够参考的全部信息。
通俗解释:就是AI现在能记住的东西。你前面说的话、上传的文件、设定的角色,都在上下文里。
实战场景:
你正在用Kimi读一份50万字的行业报告,想让它总结核心观点。Kimi的200万字上下文完全能吞下整份报告,还能基于全文回答你的追问。
但如果你用豆包分析这份报告,它的1万字上下文装不下,你就得先让AI分段总结,再基于总结提问——否则AI会“失忆”,开始胡说八道。
官方定义:基于深度学习训练的超大规模文本生成模型。
通俗解释:就是文心一言、通义千问、讯飞星火、智谱清言背后的那个“大脑”。
国内主流“大脑”对比:
官方定义:能够自主感知环境、做出决策并执行行动的AI系统。
通俗解释:普通AI像“计算器”——你输入,它输出,对话结束。Agent像“秘书”——你说“帮我安排下周去上海出差”,它会自己:
1. 查航班(调用携程API)
2. 比价酒店(调用美团API)
3. 看天气预报(调用天气API)
4. 写日程表
5. 发钉钉消息给同事确认
国内Agent应用案例:
官方定义:应用程序接口,允许不同软件之间交换数据。
通俗解释:想象你去餐厅吃饭。厨房(AI)不让你进,但有一个服务窗口(API)。你按菜单(固定格式)点菜,厨师做好后从窗口递出来。
国内AI的API应用场景:
API 让 AI 能力不再局限于独立网页,可嵌入各类软件与平台。
官方定义:模型生成看似合理但实际错误或虚构的内容。
通俗解释:AI吹牛。而且吹得特别像真的。
国内AI的真实案例:
应对策略:重要信息必须人工核查,尤其是医疗、法律、财务领域。
官方定义:先检索外部知识库,再基于检索结果生成回答。
通俗解释:考试分两种——闭卷(凭记忆)和开卷(查资料)。RAG就是让AI开卷考试。
国内RAG实战案例:
你是一家律所的行政,想用AI回答客户的法律咨询。但直接问通义千问,它可能给出过时的法条。
为什么比“直接问”更好:
答案基于你的资料,不会瞎编
可以引用原文出处,方便核查
不需要重新训练AI,成本低
官方定义:在预训练模型基础上,用特定领域数据继续训练。
通俗解释:基础AI是“通用大学毕业生”,什么都知道一点但不精。微调就是送它去上专业课。
典型应用场景:
适合做微调的情况:
不建议做微调的情况:
官方定义:神经网络中的可训练权重数量。
通俗解释:粗糙理解为“AI大脑里的神经连接数量
国内主流模型参考:
不用死记硬背所有专业术语,建议收藏本文,遇到陌生名词随时查阅。
不必被专业词汇困住使用 AI 的脚步,核心是选对工具、说清需求: