标签

AI 新纪元:从工具到助手的跨越

发布时间:2026-05-31 15:35来源:微信阅读:4

若将时光倒流至四年前,在街头询问路人 AI 的用途,得到的回答多半局限于下围棋、人脸识别或精准算法推荐等。

尽管这些功能令人惊叹,但与普通大众的生活却鲜有交集。

然而如今若再提出同样的问题,答案或许已变为撰写文章、制作 PPT、生成图像或视频,亦或是编写代码、担任客服、从事运营,甚至涉及炒股和恋爱。

仿佛就在短短数年间,AI 便从程序员的终端走进了寻常百姓家。或许有人觉得 AI 是一夜之间爆发的,但事实上,如今的 AI 是建立在数十年积累之上的成果,终于实现了从「工具」到「助手」的蜕变。

这也正是我撰写 AI 相关内容时,选择从其发展历程讲起的缘由。

或许有人认为 ChatGPT 或 Claude Code 的问世才标志着 AI 的真正诞生。但更严谨的说法是:AI 其实已积淀了数十年,而 ChatGPT 仅是首个让大众真切感知到 AI 能力飞跃的产品。

往昔的 AI 同样出色,但这种出色往往局限于特定领域,例如 AlphaGo 能战胜围棋世界冠军,又如人脸识别能从亿万张照片中锁定目标,这些 AI 都属于专才。

ChatGPT 则截然不同,它在单一领域未必最强,却几乎样样通晓,无论是文案创作、策划方案、编程开发、文章写作,还是陪伴聊天。

自从它问世以来,谷歌的 Gemini、Anthropic 的 Claude、阿里的千问、字节的豆包、百度的文心一言、月之暗面的 Kimi、幻方的 Deepseek 等模型便如雨后春笋般各领风骚。

随着各类 AI 的火爆,诸如 Agent、Skill 等新概念层出不穷。当我初次见到这些新鲜词汇时也曾感到恐慌,自 2019 年离开 AI 创业公司后,我虽偶尔仍会浏览相关 AI 资讯或新闻,但因工作重心的转移,并未深入探究。

近期我开始重新搜集资料,再次梳理了 AI 的应用分类,并利用 AI 生成了大纲,细究之下发现其实并未错过太多关键信息。不过由于信息量依然庞大,此处仍只抓主干,细枝末节不再赘述。若想深入了解,可直接向 AI 提问。

AI 的类型划分

窄域 AI

专注于单一任务或领域的“专家”。例如下围棋的 AlphaGO,或是图像识别、医疗诊断、算法推荐等。此类 AI 在特定单一领域效率极高,但相对封闭,知识难以迁移至其他系统,使用时往往需专门调用,且仅限特定场景。

窄域 AI 经封装后可被调用,便成了如今常说的 Skill。

通用 AI(AGI)

理论上,通用 AI 能够理解甚至替代人类从事的任何脑力活动,即当下人们常说的大模型。但严格而言,当前的通用 AI 尚未完全实现,现有大模型更像是强大的认知工具,其智能倾向于模仿人脑的思考方式,而非具备真正的自我意识。

这也解释了为何现在与 AI 聊天时,对方回复看似逻辑严密,却难以深究。当前的通用 AI 更多是模拟人类思维而非真正具备自我逻辑,因此常能看到 AI 做错简单计算题的新闻或视频。

自主智能体(AI Agent)

由于通用 AI 尚未完全成熟,缺乏自我意识和充分的判断力。出于实用性考虑,人们将半成熟的 AGI 与 Skill 相结合,创造出 AI Agent。

顾名思义,AI Agent 即助手之意。设定一定规则后,Agent 可按照特定工作模式替代人类操作,这也是 Agent、Claude Code 和 Codex 如此实用的原因。它们不进行自主判断,仅按既定规则完成特定任务,这也是未来 AI 在生产力上爆发的关键点,因为它们确实能替代人类完成复杂工作。

AI 的应用范畴

认知理解

无需多言,如今几乎人手一个 AI 应用。大家无论有事没事都会与 AI 对话,这便是 AI 在认知理解方面的实际应用。当然,AI 聊天仅是自然语言理解和问答的应用之一,其他还包括智能客服和知识库检索等。

此外,计算机视觉(安防、医学影像诊断、无人驾驶)以及情感识别与行为分析(心理测评等)也属于认知理解的范畴。

内容创作

涵盖文本、图像、音视频的生成。大多数专业领域人士已在实际应用,如写小说、谱曲、修图、制作视频,区别仅在于运用得好与差。

辅助决策

金融领域的风控、投资分析,乃至量化交易,如今多由 AI 承担,企业的供应链优化、生产调度等亦是如此。

智能代理

例如个人助手,以及企业的自动化工作流,甚至无人驾驶也都属于自动化和代理的范畴。像 Claude Code 就是非常得力的编程助手。

AI 的技术分类

最枯燥的内容留到最后,况且我确实对技术细节了解有限。从宏观分类来看,当下的 AI 技术离不开原有的技术基础,包括机器学习和深度学习,近几年的技术则包括生成式和多模态。

机器学习

即通过海量数据训练,让 AI 自动发现规律和模式。涵盖监督学习、无监督学习和强化学习。

监督学习涉及分类和回归,需要人工标注数据;无监督学习涉及聚类和升/降维,无需人工标注;强化学习则是通过奖励或惩罚机制优化决策。

具体应用包括信用评分、精准推荐、语音识别等。

深度学习

通过模拟人脑神经网络结构,进而处理高维复杂数据,涵盖图像、音视频和文本等。

卷积神经网络(CNN)主要用于图像处理;循环神经网络(RNN)及其变种主要用于处理序列数据,如语音和文本;Transform 及其变种主要用于处理自然语言。

具体应用包括图像识别(如 AI 换脸)、语音识别、翻译等。

生成式 AI

生成式 AI 的特点不仅在于理解数据,更在于生成新内容。涵盖文本、图像、音/视频的生成。

如今的 ChatGPT、Claude 即属此类,主要用于内容创作,包括文本创作和音视频创作,当然也包括编程。

多模态 AI

并无全新技术,主要是上述具体技术的融合,从而能处理多种类型的数据并融合理解,例如现在的文生图、文生视频等,再往前一步便是智能 Agent。

尽管如今 AI 的能力已逼近甚至在某些方面超越了人类,但 AI 仍存在幻觉、偏差以及缺乏常识理解和情景意识的问题,因此当前的 AI 更多扮演的是“助手”的角色。

如今常讨论或担忧的问题,是 AI 是否拥有思维?是否会产​​生自我意识?是否会取代人类?这些问题固然有意义,但属于未来的课题,至少当前的 AI 尚未达到那一步。

回顾 AI 的发展历史,我们会发现一个规律:每当 AI 浪潮来临时,人们总会高估其短期能力,又低估其长期影响,今日亦是如此。

从产业发展的视角看,当下的 AI 已能从替代人的体力劳动转向替代人的脑力劳动。可以说 AI 已成为新的基础设施,如同十年前的互联网,或百年前的电力。

有人觉得 AI 即将取代所有工作,也有人认为 AI 不过是一个高级搜索引擎,事实上这两种观点可能都不够准确。

AI 既不会在一夜之间改变世界,也不会像过去的许多风口那样转瞬即逝。它更像互联网初现时的模样,许多人已意识到其重要性,却尚未理解它将改变什么。

对普通人而言,现阶段最重要的事并非研究 AI 是否拥有意识或探寻 AI 的意义,而是先学会与 AI 协作。因为未来淘汰你的,大概率不是 AI,而是那些会使用 AI 的人。

我昨日用 Claude Code 编写了一个小程序,这在以前是完全不敢想象的。我说这些并非想炫耀自己有多厉害,事实上只要善用 AI,大多数人都能完成此事,哪怕完全不懂编程。

我想表达的是,我曾一度认为赚不到钱或过得不好是因为编程能力不足或其他方面能力欠缺,但实际上真正能赚钱的并非你掌握什么技能或工具,而是你能否为他人解决问题,这才是关键。

如今的 AI 只是更趁手的工具,它能帮人做许多事,但也仅只是个助手。生意还是要自己做,路还是要自己走,生活也还是要自己过。

因此不必担忧 AI,可以学好 AI,但更要过好自己的人生。