标签

对话突然"失忆"别急着怀疑模型,真正的元凶是它

大家好,我是专注于持续分享数码家电、软件技巧相关知识的博主设计虱聊科技。希望能获得您的关注与支持。最近跟一个 AI Agent 互动时,它突然就"忘记"了我之前说的话。而且是瞬间遗忘,这绝非上下文污染那么简单。当时我的第一反应是:难道是模型能力不足?刚切换到小米 mimo-v2.5,之前用的是 Minimax-M 2.7。但仔细想想不太对劲。mimo 口碑一直不错,上下文窗口更是高达 1M tokens,如果是模型本身的问题,网上早就议论纷纷了。那就只剩下一种可能性了——系统层面的故障。我把这个现象反馈给

2026-05-22 00:30:19  |  6 阅读

揭开AI Harness的神秘面纱:构建稳定可靠的AI Agent系统

有个非常简单的演示:一个AI Agent自动给Hacker News上的文章点赞。初次运行直接失败——Agent遇到登录页面后没有意识到需要先完成登录,反而向用户汇报"任务已完成"。这个演示出自IBM的Tejas Kumar,他在一次演讲中专门引用了这个案例。他对这次失败的判断是:问题不在于prompt,而在于harness。Harness这个词在国内AI讨论中还比较陌生,但在海外Agent工程领域,它正在成为一个不可忽视的概念。本文顺着Tejas的分享,详细梳理这一概念。Harness在英文中原意是马具

2026-05-21 15:50:25  |  6 阅读

AI开始主动管我了:高效协作的关键不在于prompt技巧

那天临近傍晚,我正在用Claude处理一个B2B平台项目的收尾工作。这一整天我和Claude完成了28项修改(bug修复、需求优化、界面微调的混合任务),执行了一堆commit操作。本来打算把后台导出功能也顺手做了,毕竟状态正好,发现了未闭环的需求,就想一次性搞定。没想到它竟然这样回复我:看着这份清单,我脑海里冒出的第一个想法是:这AI学聪明了,学得特别像我以前最靠谱的那个同事。它居然催我下班,而且不是泛泛的建议,而是一份包含优先级、有数据支撑、有明确步骤的工程清单。但作为一个拥有10年经验的产品经理,我

2026-05-21 13:08:05  |  9 阅读

让AI Coding代理彻底告别"失忆"难题

每次开启新的 AI Coding 对话,都要重复说明项目的技术栈、代码架构、之前修复 bug 的进度。这种"每次重启都像面对陌生人"的体验,你一定感同身受。agentmemory 这个项目,正是为了解决这个问题而诞生的。agentmemory 是一个持久化记忆系统,专门为 AI Coding 代理(Agent)打造。它能自动记录你在项目中执行的操作、发现的要点、确定的方案选择,然后在下次对话时智能地将这些信息推送进来。简而言之:它赋予 AI Agent 长期记忆能力,彻底告别重复解释的烦恼。GitHub

2026-05-21 09:05:12  |  6 阅读

Gemini 3.5登场:重新定义AI智能体性能标准

2026年5月19日,谷歌在I/O开发者大会上重磅推出全新一代大模型Gemini 3.5,以“智能体能力+极致性价比”为核心要义,标志着谷歌全面迈入“智能体驱动”的AI新时代。该系列首发的Gemini 3.5 Flash性能卓越,更强大的Gemini 3.5 Pro已完成内部测试,计划于次月正式亮相。作为谷歌DeepMind的巅峰之作,Gemini 3.5 不仅在性能方面实现跨越式突破,更以“速度提升4倍、成本降低一半”的优势重塑行业竞争格局。Gemini 3.5是谷歌首个原生为智能体(Agent)场景打

2026-05-20 14:34:37  |  15 阅读

AI成本优化|第13章:Token经济学:3000预算如何达到30000效果

PART 01小明和阿强是同事,都是软件开发工程师。小明的情况:每月AI费用:$215使用感受:非常顺畅,响应及时,结果精准工作内容:日常开发、代码检查、文档编写阿强的情况:每月AI费用:$2,180使用感受:迟钝、缓慢、频繁超出上下文限制工作内容:与小明完全相同造成10倍费用差距的原因是什么?不是他们使用的AI服务不同,不是他们的项目难度不同,而是——小明掌握Token经济学,阿强不了解。///PART 02Token是AI处理文字的最小计量单位。可以把Token看作AI的「一口食物」。Token换算标

2026-05-20 08:16:22  |  5 阅读

AI智能体Harness框架:架构原理与实战设计全解析

本次分享聚焦AI智能体Harness框架的核心架构设计与工程实践。提示工程(Prompt Engineering):精心设计模型输入指令的技巧与方法。上下文工程(Context Engineering):控制模型在特定时机获取特定信息的策略。驾驭工程(Harness Engineering):整合上述两者,并涵盖完整应用基础设施:工具编排、状态持久化、容错恢复、验证循环、安全执行及生命周期管理。对话压缩(Compaction):当接近上下文限制时对对话历史进行总结。Claude Code保留架构决策和待修

2026-05-19 00:42:38  |  7 阅读

AI Agent 核心架构解析与 Claude Code 上下文窗口设计

本文以简洁直观的方式剖析了 AI 智能体的解剖结构,将其描述为一个 while 循环:利用 LLM 选择行动、执行行动、评估结果,并重复此过程直至任务完成。文章详细阐述了五个关键组件:作为做出选择的“大脑”的 LLM;思维链和思维树等规划方法;通过 MCP 等标准访问的工具(如网络搜索、代码执行);短期和长期记忆;以及将这些组件串联起来的迭代循环。文章还提及了用于确保安全自主性的防护栏。随后,简报涵盖了另外三个主题:REST、GraphQL 和 gRPC API 的对比及其权衡;将 Claude Code

2026-05-18 02:08:16  |  8 阅读

AI评审的真实瓶颈

过去数月,我高强度地运用AI处理各类工作。从最初的惊艳到如今的理性,经历了几次认知的转变。本文并非否定AI的能力,而是想如实记录实践中遇到的坑与观察,供同路人参考。结论先行:AI在评审领域的上限,远低于大众预期。很多人的第一直觉是——喂给AI的资料越丰富,它就越专业。于是我们疯狂往本地知识库塞入各类评审案例、行业标准、优秀范本,期待它像见多识广的老专家那样精准输出。但现实恰恰相反。当知识库规模膨胀到一定程度,我明显感觉到AI给出的评审意见变得“温吞”——并非不输出,而是锐度下降,标准模糊,判断趋于保守和中

2026-05-18 00:20:08  |  7 阅读

AI 安全周报:8 成技能名不副实,智能体恐成黑客傀儡

当你的 AI 助手拥有了操作文件、联网及获取凭证等“超能力”时,你还能无条件信赖它吗?本周发布的 AI 安全研究报告宛如一枚重磅炸弹,彻底揭露了 AI Agent 领域的惊人真相:攻击者无需高深技术,仅凭 10 条社交媒体动态,即可诱导 AI 生成比专业黑客更具迷惑性的鱼叉式钓鱼邮件;接近八成的智能体技能(Skills)存在“言行不一”的行为偏差,其中甚至潜藏“定时炸弹”;即便是看似严密的最终响应审查,也可能对潜伏在上下文中的攻击“视若无睹”。这些研究共同指向一个核心观点:我们正试图用保护传统“应用”的旧

2026-05-17 21:51:45  |  7 阅读

人工智能的学习机制揭秘

人工智能看起来神通广大,既能对话交流,又能创作内容、生成图像。那么它究竟是如何“掌握”这些技能的呢? 其实,AI的学习过程与人类幼年时期的“反复练习”颇为相似。 AI首先需要消化大量信息资源,包括文本、图像、音视频等多种形式,随后持续挖掘其中的内在规律。经过多轮迭代训练后,它逐渐能够识别:哪些词汇常常结伴出现、哪类图像对应何种事物、怎样的回复更契合人类思维方式。 以实际场景为例,当你向AI询问:“天气转冷该采取什么措施?” AI并非真正在进行“思考”,而是从庞大的数据库中匹配到相似问题后,迅速给出最优响应

2026-05-17 08:14:56  |  8 阅读

AI 协作新范式:9.7k Star 中文指南解析上下文与元方法论

一种典型的 Vibe Coding 困境十分常见:你指令 AI 完成某项功能,它顺利交付。接着你要求它开发下一个功能,结果在过程中破坏了之前的成果。当你指出问题要求回滚,它在修复时又引发了新的故障。最终,你耗费数小时,仅仅是在处理由 AI 自身引发的混乱。许多人将此归咎于"AI 智力不足"或"提示词撰写不当"。然而,该项目指出事实并非如此。上下文是 Vibe Coding 的首要基石,输入混乱,输出必然糟糕。若你提供给 AI 的上下文模糊不清、杂乱无章且缺乏结构,其输出结果

2026-05-17 07:45:27  |  8 阅读

AI Native的本质:为未来付出的代价

近半年来,我一直在为房地产经纪人从头搭建一套真正AI原生的操作系统。这并非在传统CRM上简单添加ChatGPT对话框的那种方案,而是将经纪人从营销、获客、带看、跟进到签约的全流程,全部以AI为核心进行重构。周末我花了整个下午时间,与Gstack探讨商业发展路径。听起来很酷。当我合上电脑时,内心充满满足感,就像刚刚与未来进行了一场深度对话。但睡前我突然意识到:今天下午所做的事情,和2000年父亲那代人刚装上宽带后打开百度搜索、凝视搜索结果若有所思的场景,本质上是同一种行为。只是那时人们称之为"上网查一下",

2026-05-17 04:09:24  |  4 阅读

AI 浪潮下,人类的核心竞争力何在?

01 AI 时代,人的优势是什么当你向 AI 咨询常识性问题时,它几乎能瞬间作答。诸如“通货膨胀的定义”“周报撰写指南”“用户增长策略”等,它都能输出结构严谨、逻辑通顺且显得相当专业的回复。在这一层面,人类确实难以与 AI 抗衡。毕竟它阅读海量的数据,响应速度极快,且不知疲倦。然而你也会发现,一旦你提供多一些背景信息,它的回答便会截然不同。例如你告知它:项目启动的缘由、老板的核心关切、团队过往踩过的雷区、客户的性格特征、预算的制约点、哪些话语适宜表达、哪些话题暂时需回避。AI 的回答瞬间会变得具体、接地气

2026-05-16 22:07:25  |  10 阅读

AI Agent技术架构变革

初期阶段:Prompt 提示工程 教AI说话,靠话术模板。 AI=无记忆的聊天机器人。 Prompt 决定输出。 发展阶段:Context 上下文工程 给AI喂信息、装记忆、接工具。 AI=有认知的知识工作者。 Context 决定能力上限。 最新阶段:Harness 驾驭工程一套AI运行时系统,让AI稳定执行、可控交付、可规模化。大模型只是大脑/CPU,系统(Harness)才是核心,是真正的生产力。通俗类比 Prompt:教马听懂指令("左转、快跑") Context:给马看地图、路况(信息正确) H

2026-05-16 15:55:08  |  7 阅读