Arth_标签-酷阅新闻

AI+Arthas实战：从人肉救火到智能诊断的全面解析

凌晨 2 点 57 分，订单服务出现异常：P99 响应时间从 180ms 飙升至 8.3s，单 Pod CPU 占用率接近 95%，Full GC 频率从十几分钟缩短到几十秒。值班群里顿时一片哗然：经过 40 多分钟的排查，最终确认原因：一条慢 SQL 引发了业务锁竞争，进而演变成线程阻塞和 GC 频繁抖动。此类故障频频发生，并非团队缺乏排查能力，而是传统排查流程存在四个天然的短板：因此，本文探讨的核心并非“如何将 Arthas 接入 AI”，而是更具工程意义的问题：如何将 JVM 在线诊断从“专家人工排

2026-05-02 22:18:03 | 29 阅读