AI 赋能：构建个人操作系统 EthanOS 的思考与实践

发布时间：2026-05-09 02:08阅读：10

随着 AI 工具的日益强大，我越来越清晰地认识到，工具的进步并不能自动构成一个完整的系统。

这是我在过去一段时间深度体验各类 AI 工具后，得出的一个坚定结论。

起初，我的关注点在于寻找更强大、更精确的 AI 工具。我构建了一个名为“小虾”的个人 AI 智能体，耗费两个通宵才最终搭建完成。为了让“小虾”能够遵循我的工作流程，我从最初的“安装现成技能”逐步转向“编写自定义技能”，其中最常用的是“入库”功能。我同时订阅了四家厂商的模型服务，并为它们进行了明确的“职责划分”：能力出众但成本较高的专家模型用于攻克难题和处理复杂任务；而量大且成本较低的模型则充当高效的“赛博打工人”。

然而，在深入使用的过程中，我逐渐意识到——需求的根本解决并不在于工具本身。

我常常在会议间隙突然产生一个想法，或在通勤途中想起需要处理的事项，因此“随时记录日程、进度、闪现的念头和灵感”对我而言是必不可少的。但我无法随时打开笔记应用进行记录——等我打开 Obsidian，可能要记录的内容就已经遗忘了。最初，我尝试通过飞书向“小虾”发送消息来实现即时记录并生成本地 .md 笔记文件。

我曾以为，只需撰写一份任务 SOP（标准作业程序）文档，以“入库”作为触发词，让“小虾”按照指示执行，就能轻松满足这个“看似简单”的需求。

但我错了。有一次，我对“小虾”说：“入库，今天我完成了一个 B 站视频摘要任务的 SOP，并且通过你成功跑通了流程，非常高兴。”本意只是想将这句话记录在我的笔记中，却发现“小虾”并未执行我的入库指令，反而误以为我在与它闲聊，并给予了极高的情感回应：“太好了，我真为你感到高兴。”更糟糕的是，在缺乏上下文的指示下，“小虾”有时根本没有意识到这是一个专项任务，因此不会去查阅“SOP 说明书”，自然也无法执行。

实际上，只需在指令中加上一句“请根据 SOP 的指引执行入库任务”，就能解决触发问题。但对于即时记录这种高频操作而言，在具体内容前添加这句提示词本身就是一种阻碍。

我必须同时满足两个要求：既要简化操作，又要保证执行的稳定性。

最终，我采用了一套组合策略：将 SOP 流程文档“技能化”（脚本调用）+ 系统级快捷指令 + 即时通讯工具 + 语音输入。虽然这并非理论上最完美的解决方案，但它是我目前能找到的较为理想且可行的方案。

至此，我才更清晰地认识到：AI 协同合作的真正难点不在于“一次性完成”，而在于“稳定、可控、可重复地正确执行”。

模型越强大，工具越多，如果个人未能梳理清楚自身的目标、判断和工作流程，AI 反而会放大混乱。

在系统学习 AI 之前，我总担心存在较高的技术门槛。稍有入门后，我又开始寄希望于寻找更强大的工具，甚至将希望寄托在每一次模型版本的更新上。

然而，实践越多，我越觉得这种方向存在问题。

只要 AI 还需要人类使用自然语言进行调用，需要提供上下文，那么清晰地表达自身需求的能力，就仍然是影响最终效果的关键瓶颈。

因此，与其将“更有效、更高效”的希望完全寄托于工具自身的迭代升级，不如回过头来做一件更具挑战性且更具长期价值的事情：

“蒸馏”自己。

我所说的“蒸馏自己”，并非指让 AI 记住关于我的信息。它至少包含两层含义。

第一层：让 AI 真正理解“我是谁”。

以我最看重的一点为例：我会明确告知 AI“不要默认迎合我”。

我观察到，AI 大语言模型普遍存在一种附和用户的默认倾向——无论你说什么，它们都会先表示肯定，甚至放弃独立判断。但我使用 AI 的目的是解决问题，而非获得赞美。我更需要它站在与我不同的角度，提供中立的分析、评估，甚至直接的反驳。

如果这一偏好不被明确写入，AI 就会以一种面向最大公约数用户的安全模式与我协作，即便是 ChatGPT 和 Claude 也无法避免。而我已经不再满足于这种协作方式。

第二层：让我的工作流程能够层层叠加，持续发展。

举个例子。我首先创建了“入库”技能，让“小虾”负责处理我日常的零散记录。在它稳定运行后，我又开发了“周报”技能——它能够从我一周的入库内容中筛选出值得写入周报的条目，进行分类、润色和结构化整理，我只需审阅初稿并进行少量修改即可。

“入库”技能是“周报”技能的基础。没有“入库”技能长期积累的内容，“周报”技能就只是一个空壳。

这件事让我意识到，“蒸馏自己”并非一次性定义所有内容，而是沉淀一个个独立的模块，使它们能够相互叠加、相互调用。

我相信，通过这种持续的成长，我或许能更接近心中对“操作系统”形态的构想。

然而，“蒸馏自己”这件事本身非常困难。

我常常误以为自己“知道”。

但“知道”与“表达”是两回事。“表达”与“让 AI 稳定理解”又是另外两回事。

例如，我花了一段时间才意识到：我不喜欢 AI 在回答前先进行“关系对齐”——即先复述我的观点、表明自己是否认同，然后再进入正题。这个问题我心里一直“知道”，但要将其精确地表达出来——不仅仅是“别迎合”或“直接一点”，而是“不要先进行关系对齐式的回应”——本身就需要一次提炼。

对我而言，AI 已不再仅仅是工作伙伴，更像是我的参谋和顾问——它不仅为我提供分析和方案，也在反过来促使我更清晰地思考问题。

在项目启动时，我通常只会向 AI 表达一个方向性的想法。例如：我想开发一个工具，用于提取每周记录的信息，并自动生成周报。从产品开发的视角来看，这仅仅是一个需求，距离可用于开发的文档还相去甚远。

但在 Claude Code 的 Plan Mode 中，它会反过来追问我：

从入库素材中提取周报项，范围如何界定？

每一项素材是只说明当前进度，还是需要包含遇到的困难和所需的支持？

如果两条素材指向同一件事，是否需要合并？

这些问题的回答，会迫使我将粗糙的想法逐渐转化为真正的产品文档。

另一个原因是，AI 工具的迭代速度非常快。今天某个工具可能很新颖，明天就可能被平台功能所取代；今天看似先进的工作流，在下一代模型出现后可能就需要重写。

我自己的“小虾”就是这样的存在。这种自建的智能体最容易被未来的某个新产品直接替代。我花费两个通宵将其搭建并运行起来，但清楚地知道它绝非终点。

因此，我越来越关注那些不易快速贬值的事物——如何定义问题、如何构建工作流、如何沉淀个人判断、以及不同技能之间如何叠加。这些要素并不完全依赖于某个模型，也不完全依赖于某个平台。

EthanOS 的目标不是追赶每一个新工具，而是构建一套能够吸收、调度和替换新工具的底层系统。

EthanOS 是一个长远愿景

EthanOS 并非我现已完成的项目，它更像是一座灯塔。

它在远方警示我，不要只追逐下一个工具，不要将希望完全寄托在某个模型或平台的升级上，而是逐步将自己的目标、判断和工作流构建成一套个人操作系统。

我不想撰写那种“再不学习 AI 就将被淘汰”的文章，焦虑很容易制造，但缺乏建设性。AI 时代已经足够喧嚣，不差我再敲一面锣。

EthanOS 更像是一份记录，它是一个长期面对复杂决策环境的实践者，在与 AI 协作的过程中逐渐摸索出的真实记录。它不一定是标准答案，但会尽量记录当下的真实感受。

如果你也在进行类似的尝试，希望 EthanOS 能成为你前行道路上的一盏小灯。

在一个周末的早晨，我打开 ChatGPT，敲下了一段现在看来略显粗糙的话：

讨论一个关于 vibe coding 的产品构想：目前网易云音乐的 Mac 客户端极其难用，因为它太臃肿，非常卡顿。我想开发一个接入网易云 API、重新设计前端 UI（非常轻量级）的个人电台应用，仅供本地使用。你有什么看法？

当时它还不叫 Floe，没有图标，没有代码，甚至算不上一个像样的需求。更像是一句带有方向性的抱怨。

我对网易云音乐的使用其实非常单一——只听私人 FM。我想要的只是一个漂浮在桌面角落的小工具，安静、轻便、不干扰注意力，打开即可播放。

围绕着这种气质，我砍掉了几乎所有可以砍掉的功能。它无法搜索歌曲，甚至连上一首的按钮都没有。它只能做一件事：登录我的网易云账号，播放我的私人 FM。

随后是大量的精细调试——画布的大小，中英文的字体搭配，在暗色背景下是否需要添加一道极其微弱的边缘泛光。

现在，Floe 被我固定在程序坞里，每天都会打开。她真的存在了——可以打开，可以使用，安安静静地待在那里。

EthanOS 想要记录的，正是这样的故事。

← 上一篇：AI产品经理的“一人公司”投资策略下一篇：AI领衔主升浪,科技风暴席卷全球 →