Cloudflare上线网站AI Agent就绪度评估工具

发布时间：2026-04-19 08:41阅读：22

Cloudflare官方宣布上线isitagentready.com检测工具，旨在协助站长衡量其站点对AI Agent的兼容性。该平台不仅能给出多维度的评分结果，还能直接生成提示词，供编码Agent自动执行优化操作。

Cloudflare宣布发布isitagentready.com检测工具以及Cloudflare Radar数据集，主要目的是协助站长评估其网站对接AI Agent的准备工作。

依据官方对全网20万个顶级域名的扫描数据，目前互联网上Agent的就绪率普遍偏低。虽然传统的SEO基础设施普及率较高，但针对Agent的语义层、授权层和支付层等新兴标准几乎还是一片空白。

该工具通过可发现性、内容可访问性、Bot访问控制和协议发现四个维度对网站进行打分，并单独检查Agentic Commerce支付协议的兼容性。

针对未通过检查的项目，该平台会直接生成提示词，以便开发者将其交给编码Agent进行自动修复。

同时，Cloudflare率先垂范，通过构建分形结构的llms.txt、实现Markdown内容协商回退、引入AI训练爬虫重定向以及隐藏Agent指令等手段，对其开发者文档进行了重构。

Cloudflare推出了名为“Agent Memory”的托管服务私有测试版。该服务能够提取并按需提供关键信息，赋予智能体持久化记忆的能力，既能记住重要内容，也能自动遗忘无用的信息。

根据Cloudflare官方博客发布的信息，该公司已正式推出“Agent Memory”托管服务的私有测试版。

该服务旨在解决AI Agent在长期运行中遇到的“上下文污染”问题。通过从对话中提取关键信息并在需要时提供，从而避免无效地填满上下文窗口。

“Agent Memory”赋予了Agent持久化记忆能力，使其能够记住重要信息、遗忘无用内容，并随着时间的推移不断进行优化。

该技术主要通过固定的API和基于检索的架构运行，支持单个Agent记忆、自定义Agent框架以及跨人员与工具的共享记忆。

目前该服务已接入Cloudflare Workers并提供REST API，用户可以通过官方渠道申请加入候补名单以获取早期访问权限。

xAI宣布推出Grok语音转文本和文本转语音两款独立的音频API，旨在帮助开发者轻松集成高质量的语音功能。官方数据显示，这两项服务不仅具备高精度、低延迟和细粒度情感控制等特性，其词错率和收费标准也均低于多家同行竞品。

xAI近日正式发布了音频API：Grok Speech to Text (STT)和Grok Text to Speech (TTS)。

上述两款API基于驱动Grok Voice、Tesla车载系统以及Starlink客户支持的同一底层技术栈构建，旨在帮助开发者将高质量的语音功能轻松集成到包括语音Agent、实时转录工具、无障碍辅助方案、播客及交互式音频体验在内的各类应用中。

其中，Grok STTAPI现已正式上线，具备高精度与低延迟特性，支持25种以上语言的无缝切换，并提供字级时间戳、说话人分离及多通道支持等高级功能。

根据官方博客公布的数据，其企业级转录能力在多种场景的词错率表现中优于官方列出的ElevenLabs、Deepgram和AssemblyAI的相关测试数据。且官方声称该产品在批量与流式转录的每小时定价上均低于上述同行竞品。

与此同时，Grok TTSAPI支持通过简单的内联或包裹式语音标签实现对韵律和情感的细粒度控制。

月之暗面与清华大学提出了Prefill-as-a-Service架构。该架构利用Kimi Linear等混合注意力模型大幅减小KVCache的特性，结合选择性路由与带宽和缓存感知调度，打破了异构Prefill/Decode必须处于同一RDMA网络的限制。它将超过阈值的长Prefill请求路由至独立的算力密集型集群，再经普通以太网将KVCache传回本地集群进行Decode。该方案相比同构PDbaseline吞吐量更高、TTFT更低。

月之暗面与清华大学发布的预印本提出了Prefill-as-a-Service（PrfaaS），其核心是基于跨数据中心KVCache的异构Prefill/Decode解耦serving架构。

论文的出发点是，传统的dense-attention模型在Prefill阶段会生成体量很大的KVCache，跨节点传输成本高，因此现实中的PD disaggregation往往仍受限于单个数据中心内的高带宽、低时延RDMA网络域。

随着以Kimi Linear为代表的混合注意力架构逐步普及，模型在长上下文场景下的KVCache规模与KV吞吐量明显下降，跨集群、跨数据中心传输KVCache开始进入可行区间。

基于这一前提，PrfaaS将模型侧的KVCache缩减与系统侧的调度和缓存管理结合起来：对增量未缓存长度超过阈值的长请求，系统会选择性地将Prefill路由到独立的、算力密集型Prefill集群；对较短请求，则继续保留在本地PD路径上执行。

远端Prefill完成后，生成的KVCache通过普通以太网传回本地PD集群，由后者继续承担Decode。

为使这一流程在真实负载下稳定运行，论文进一步引入了长度阈值路由、带宽感知调度、缓存感知请求放置、全局KVCache manager、hybrid prefix cache pool，并配合layer-wise prefill pipelining、multi-connection TCP与拥塞监控来平滑跨集群传输流量。

这样一来，异构的Prefill与Decode资源可以部署在松耦合的不同集群、不同机房甚至不同区域中，部署条件不再要求它们处于同一个RDMA高带宽网络域内，同时也便于分别扩展计算密集型Prefill能力与带宽密集型Decode能力。

论文中的case study使用了一个遵循Kimi Linear架构的内部1T混合模型，在约100Gbps的跨集群链路、32张H200组成的PrfaaS集群和64张H20组成的本地PD集群配置下，得到的最优策略会将约一半的长请求路由到PrfaaS，平均跨集群带宽占用约13Gbps。

相比homogeneousPDbaseline，系统吞吐提升54%，相比naive heterogeneous baseline提升32%，同时平均TTFT降低50%，P90 TTFT降低64%。

据报道，OpenAI于当地时间周五发生重大人事变动。前首席产品官Kevin Weil、Sora负责人Bill Peebles以及B2B Applications首席技术官Srinivas Narayanan三名核心高管同日宣布离职。

据媒体报道，OpenAI日前发生重大人事变动，三名核心高管于当地时间周五同日宣布离职。

此次离职的高管包括前首席产品官兼OpenAI for Science负责人Kevin Weil、Sora负责人Bill Peebles，以及B2B Applications首席技术官Srinivas Narayanan。

这一系列人事变动发生在该公司整合内部资源、削减边缘项目并将战略重心转向企业级AI业务及拟议“超级应用”的大背景下。

根据官方发言人的声明，OpenAI正在统一其业务和产品战略，其中Weil负责的科学项目将被分散并整合至其他研究团队，其旗下的科学家人工智能工作区Prism将并入AI开发者助手Codex。

此外，Peebles离职前负责的Sora已于上个月因成本和算力限制被彻底关停。

据知情人士透露，Narayanan的离职与另外两人无关。

xAI已经向部分订阅用户开放了0.5T参数规模的Grok 4.3测试版。马斯克澄清，这并非网传的1T模型。他透露，预计5月会陆续推出1T和1.5T版本的升级模型。未来计划每两周更新一次基础模型。

xAI日前向SuperGrok Heavy订阅用户开放了Grok 4.3 (beta)的早期访问权限。

尽管有用户推测该版本拥有1T参数，但Elon Musk随后澄清，当前的Grok 4.3仍是0.5T模型。

Musk透露，真正的1T旗舰模型距离完成初始训练还需约5天。

根据其公布的路线图，基于该1T架构的Grok 4.4预计于5月初发布，而1.5T规模的Grok 4.5则有望在5月底推出。

此外，Musk表示SpaceXAI模型工厂已跑通，未来预计每两周下线一版改进后的基础模型。

提示：内容由AI辅助创作。

作者橘鸦Juya。

← 上一篇：2026青少年人工智能挑战赛报名开启，白名单赛事助力升学下一篇：五部门发布AI教育新规：教育数字化迈向系统重构深水区 →