标签

LLM智能客服架构重构与优化

一次从"让 LLM 自由发挥"到"用状态机精确控制"的架构重构实践最近我对自研的 AI 智能客服系统做了一次比较彻底的架构重构——V4 版本。这次重构的核心变化是:从向量记忆驱动转向了状态机驱动。V4架构图:简单说就是:以前每个环节都丢给 LLM 去"自由发挥",现在用结构化状态 + 显式规则来控制流程。效果很直接——Token 消耗大幅降低、流程完全可控、可观测性也好了很多。这篇文章分享一下这次重构的思路、做法和一些具体的代码实现。先快速回顾一下这个系统的

2026-06-01 20:00:29  |  4 阅读

AI优先究竟意味着什么

借助人工智能,曾经需要两个月才能完成的功能,现在可以在提出需求的当天就完成开发并进行AB测试,当晚就能迭代出更优版本。之所以能如此高效,是因为我们的工作流程深度融入了人工智能,从需求分析到开发实现,从测试验证到部署上线的每个环节都发生了根本性转变。如今研发团队的使命已不再是单纯编写代码,而是让人工智能高效地产出有价值的成果。因此即便出现问题时,也无需绞尽脑汁寻找更好的解决方案,而是思考如何让人工智能快速识别并修复问题。但这就叫AI优先吗?可以说是吧。每天上班打开Codex、Claude Code,开会讨论

2026-04-15 13:04:04  |  7 阅读

AI算力竞赛拐点:架构重构挑战

当前市场对AI算力的理解仍停留在‘国产替代’和‘需求爆发’的线性叙事上,普遍高估了单纯硬件堆砌的线性机会,而低估了由‘效率焦虑’驱动的架构重构所带来的非线性变革。真正的变量Y,是摩尔定律放缓背景下,追求单位算力成本(TCO)最优化的强大压力。因此,最被低估的投资机会Z,并非仅仅是更多的芯片和服务器,而是支撑超大规模AI集群高效、稳定运行的‘提效降本’核心环节——光互联、液冷、高速互联芯片及集群架构创新。

2026-04-04 02:18:42  |  6 阅读