SaaS-Bench评测揭示:AI办公的残酷现实与环保困境
今天想和大家分享一组令人尴尬的数据,以及一个比尴尬更值得深思的问题。2026年被业界称为"AI Agent元年"。在博鳌论坛上,各大厂商纷纷推出Computer-Use功能——听起来,AI替人类工作的美好前景似乎已经触手可及。然而就在同一天,一份评测报告彻底打破了这种乐观预期。5月25日,UniPat AI发布了SaaS-Bench评测报告。该报告选取23个真实SaaS系统、106个办公任务,对Claude、Kimi、Gemini等主流大模型进行了全面测试。测试结果令人震惊:表现最优秀的Claude Op