解析 OpenAI 内部数据智能体实战
定位:专为内部打造的 AI 数据智能助手
•替代方案:OpenAI 自研数据平台
•服务超 3,500 名内部员工,涵盖 600PB 数据及 7 万组数据集
•支持 Slack、IDE、ChatGPT 及 CLI 等多种接入方式
实现路径,他们如何构建:
A:依托 Codex(GPT5.5)、Evals API 及 Embeddings API
数据分析师的核心职能
•应是:界定关键指标、校验假设并制定数据驱动策略。
•而非陷入 SQL 语义调试或查询性能优化
运作机制
•智能体由 GPT‑5.2 提供动力
•流程:从用户提出复杂开放性问题,延伸至分析、数据、查询至图表生成
•自动化:自动查找数据表、解析架构、调试查询、执行分析,并利用记忆模块学习组织上下文
•不再依赖 SELECT ...
•而是采用
自然语言→领域专用语言/语义规划推理
→受控运行时进行流程编排
→查询编译器处理代码
→最终执行查询
•原文着重指出:Codex 读取流水线代码这一核心理念
原文来源:https://openai.com/zh-Hans-CN/index/inside-our-in-house-data-agent/