标签

AI 赋能:构建个人操作系统 EthanOS 的思考与实践

发布时间:2026-05-09 02:08来源:微信阅读:5

随着 AI 工具的日益强大,我越来越清晰地认识到,工具的进步并不能自动构成一个完整的系统。

这是我在过去一段时间深度体验各类 AI 工具后,得出的一个坚定结论。

起初,我的关注点在于寻找更强大、更精确的 AI 工具。我构建了一个名为“小虾”的个人 AI 智能体,耗费两个通宵才最终搭建完成。为了让“小虾”能够遵循我的工作流程,我从最初的“安装现成技能”逐步转向“编写自定义技能”,其中最常用的是“入库”功能。我同时订阅了四家厂商的模型服务,并为它们进行了明确的“职责划分”:能力出众但成本较高的专家模型用于攻克难题和处理复杂任务;而量大且成本较低的模型则充当高效的“赛博打工人”。

然而,在深入使用的过程中,我逐渐意识到——需求的根本解决并不在于工具本身。

我常常在会议间隙突然产生一个想法,或在通勤途中想起需要处理的事项,因此“随时记录日程、进度、闪现的念头和灵感”对我而言是必不可少的。但我无法随时打开笔记应用进行记录——等我打开 Obsidian,可能要记录的内容就已经遗忘了。最初,我尝试通过飞书向“小虾”发送消息来实现即时记录并生成本地 .md 笔记文件。

我曾以为,只需撰写一份任务 SOP(标准作业程序)文档,以“入库”作为触发词,让“小虾”按照指示执行,就能轻松满足这个“看似简单”的需求。

但我错了。有一次,我对“小虾”说:“入库,今天我完成了一个 B 站视频摘要任务的 SOP,并且通过你成功跑通了流程,非常高兴。”本意只是想将这句话记录在我的笔记中,却发现“小虾”并未执行我的入库指令,反而误以为我在与它闲聊,并给予了极高的情感回应:“太好了,我真为你感到高兴。”更糟糕的是,在缺乏上下文的指示下,“小虾”有时根本没有意识到这是一个专项任务,因此不会去查阅“SOP 说明书”,自然也无法执行。

实际上,只需在指令中加上一句“请根据 SOP 的指引执行入库任务”,就能解决触发问题。但对于即时记录这种高频操作而言,在具体内容前添加这句提示词本身就是一种阻碍。

我必须同时满足两个要求:既要简化操作,又要保证执行的稳定性。

最终,我采用了一套组合策略:将 SOP 流程文档“技能化”(脚本调用)+ 系统级快捷指令 + 即时通讯工具 + 语音输入。虽然这并非理论上最完美的解决方案,但它是我目前能找到的较为理想且可行的方案。

至此,我才更清晰地认识到:AI 协同合作的真正难点不在于“一次性完成”,而在于“稳定、可控、可重复地正确执行”。

模型越强大,工具越多,如果个人未能梳理清楚自身的目标、判断和工作流程,AI 反而会放大混乱。

在系统学习 AI 之前,我总担心存在较高的技术门槛。稍有入门后,我又开始寄希望于寻找更强大的工具,甚至将希望寄托在每一次模型版本的更新上。

然而,实践越多,我越觉得这种方向存在问题。

只要 AI 还需要人类使用自然语言进行调用,需要提供上下文,那么清晰地表达自身需求的能力,就仍然是影响最终效果的关键瓶颈。

因此,与其将“更有效、更高效”的希望完全寄托于工具自身的迭代升级,不如回过头来做一件更具挑战性且更具长期价值的事情:

“蒸馏”自己。

我所说的“蒸馏自己”,并非指让 AI 记住关于我的信息。它至少包含两层含义。

第一层:让 AI 真正理解“我是谁”。

以我最看重的一点为例:我会明确告知 AI“不要默认迎合我”。

我观察到,AI 大语言模型普遍存在一种附和用户的默认倾向——无论你说什么,它们都会先表示肯定,甚至放弃独立判断。但我使用 AI 的目的是解决问题,而非获得赞美。我更需要它站在与我不同的角度,提供中立的分析、评估,甚至直接的反驳。

如果这一偏好不被明确写入,AI 就会以一种面向最大公约数用户的安全模式与我协作,即便是 ChatGPT 和 Claude 也无法避免。而我已经不再满足于这种协作方式。

第二层:让我的工作流程能够层层叠加,持续发展。

举个例子。我首先创建了“入库”技能,让“小虾”负责处理我日常的零散记录。在它稳定运行后,我又开发了“周报”技能——它能够从我一周的入库内容中筛选出值得写入周报的条目,进行分类、润色和结构化整理,我只需审阅初稿并进行少量修改即可。

“入库”技能是“周报”技能的基础。没有“入库”技能长期积累的内容,“周报”技能就只是一个空壳。

这件事让我意识到,“蒸馏自己”并非一次性定义所有内容,而是沉淀一个个独立的模块,使它们能够相互叠加、相互调用。

我相信,通过这种持续的成长,我或许能更接近心中对“操作系统”形态的构想。

然而,“蒸馏自己”这件事本身非常困难。

我常常误以为自己“知道”。

但“知道”与“表达”是两回事。“表达”与“让 AI 稳定理解”又是另外两回事。

例如,我花了一段时间才意识到:我不喜欢 AI 在回答前先进行“关系对齐”——即先复述我的观点、表明自己是否认同,然后再进入正题。这个问题我心里一直“知道”,但要将其精确地表达出来——不仅仅是“别迎合”或“直接一点”,而是“不要先进行关系对齐式的回应”——本身就需要一次提炼。

对我而言,AI 已不再仅仅是工作伙伴,更像是我的参谋和顾问——它不仅为我提供分析和方案,也在反过来促使我更清晰地思考问题。

在项目启动时,我通常只会向 AI 表达一个方向性的想法。例如:我想开发一个工具,用于提取每周记录的信息,并自动生成周报。从产品开发的视角来看,这仅仅是一个需求,距离可用于开发的文档还相去甚远。

但在 Claude Code 的 Plan Mode 中,它会反过来追问我:

从入库素材中提取周报项,范围如何界定?

每一项素材是只说明当前进度,还是需要包含遇到的困难和所需的支持?

如果两条素材指向同一件事,是否需要合并?

这些问题的回答,会迫使我将粗糙的想法逐渐转化为真正的产品文档。

另一个原因是,AI 工具的迭代速度非常快。今天某个工具可能很新颖,明天就可能被平台功能所取代;今天看似先进的工作流,在下一代模型出现后可能就需要重写。

我自己的“小虾”就是这样的存在。这种自建的智能体最容易被未来的某个新产品直接替代。我花费两个通宵将其搭建并运行起来,但清楚地知道它绝非终点。

因此,我越来越关注那些不易快速贬值的事物——如何定义问题、如何构建工作流、如何沉淀个人判断、以及不同技能之间如何叠加。这些要素并不完全依赖于某个模型,也不完全依赖于某个平台。

EthanOS 的目标不是追赶每一个新工具,而是构建一套能够吸收、调度和替换新工具的底层系统。

EthanOS 是一个长远愿景

EthanOS 并非我现已完成的项目,它更像是一座灯塔。

它在远方警示我,不要只追逐下一个工具,不要将希望完全寄托在某个模型或平台的升级上,而是逐步将自己的目标、判断和工作流构建成一套个人操作系统。

我不想撰写那种“再不学习 AI 就将被淘汰”的文章,焦虑很容易制造,但缺乏建设性。AI 时代已经足够喧嚣,不差我再敲一面锣。

EthanOS 更像是一份记录,它是一个长期面对复杂决策环境的实践者,在与 AI 协作的过程中逐渐摸索出的真实记录。它不一定是标准答案,但会尽量记录当下的真实感受。

如果你也在进行类似的尝试,希望 EthanOS 能成为你前行道路上的一盏小灯。

在一个周末的早晨,我打开 ChatGPT,敲下了一段现在看来略显粗糙的话:

讨论一个关于 vibe coding 的产品构想:目前网易云音乐的 Mac 客户端极其难用,因为它太臃肿,非常卡顿。我想开发一个接入网易云 API、重新设计前端 UI(非常轻量级)的个人电台应用,仅供本地使用。你有什么看法?

当时它还不叫 Floe,没有图标,没有代码,甚至算不上一个像样的需求。更像是一句带有方向性的抱怨。

我对网易云音乐的使用其实非常单一——只听私人 FM。我想要的只是一个漂浮在桌面角落的小工具,安静、轻便、不干扰注意力,打开即可播放。

围绕着这种气质,我砍掉了几乎所有可以砍掉的功能。它无法搜索歌曲,甚至连上一首的按钮都没有。它只能做一件事:登录我的网易云账号,播放我的私人 FM。

随后是大量的精细调试——画布的大小,中英文的字体搭配,在暗色背景下是否需要添加一道极其微弱的边缘泛光。

现在,Floe 被我固定在程序坞里,每天都会打开。她真的存在了——可以打开,可以使用,安安静静地待在那里。

EthanOS 想要记录的,正是这样的故事。