HPE的人工智能治理之路：从概念到实践

发布时间：2026-04-03 17:36阅读：32

HPE借助混合基础设施、AI可观测性和全生命周期管理，将人工智能治理转化为实际操作，帮助企业大规模部署负责任的AI系统。

人工智能已不再是企业未来规划中的概念，它已在生产环境中运行，做出关键决策，并影响业务的各个方面。当前企业面临的挑战是如何负责任地、大规模地管理和运营AI，以实现可衡量的效果。

在HPE，我们不仅制定AI政策框架，还将其转化为具体实践，融入基础设施、工作流程和企业文化中。本文将分享我们的实践经验，以及这对身处AI时代的企业为何至关重要。

从AI原则到AI运营：填补治理差距

许多企业发布了AI准则，但真正能构建运营体系来执行这些准则的企业却很少。HPE将这一差距称为“治理鸿沟”，即声明的AI价值观与模型在部署、再训练或退役时实际发生的情况之间的差异。

填补这一鸿沟需要我们将AI治理视为一门运营学科，配备专门的工具、指标、责任主体和反馈机制，而不仅仅是一项法律或合规职能。

HPE观点： AI治理必须嵌入机器学习运营（MLOps）流程中，而非独立存在。

HPE生产环境中的每个模型都有明确的责任人、风险分类、数据血缘记录和自动化监控策略，这些均通过HPE AIOps框架进行管理。

HPE AI治理实践四大支柱

支柱一：负责任AI设计

HPE将负责任AI准则嵌入模型设计阶段，而非事后审核。这意味着，在编写任何模型代码之前，每项AI计划都要经过结构化的AI影响评估。该评估涵盖：

训练数据与决策输出中潜在的偏见风险

监管适用性（GDPR、欧盟AI法案、美国AI行政令）

高风险决策中的人机协同要求

基于最终用户场景的可解释性要求

HPE与开放标准企业的合作，包括对NIST AI风险管理框架的贡献，反映了我们的信念：治理应该是行业性的，而非专有的。

支柱二：实现AI管控的混合基础设施

没有基础设施管控的治理只能是愿景。HPE的“混合设计”理念使企业能够根据数据主权、延迟和合规要求，灵活选择AI工作负载的运行位置。

通过GreenLake，客户获得了一个统一的AI基础设施控制平面。这意味着：

跨异构AI环境的集中化策略执行

遵守特定辖区法规的数据驻留控制

不牺牲治理连续性的工作负载可移植性

与可持续发展目标对齐的实时资源分配

关键差异化优势：与超大规模优先的策略不同，HPE的混合模式确保治理策略跟随工作负载，而非相反。企业在保持云灵活性的同时，仍能控制AI技术栈。

支柱三：AI可观测性与持续合规

模型部署只是治理旅程的开始。HPE通过AI可观测性将持续合规落地为实践，这是一套用于监控生产环境中模型表现的实践与工具，涵盖：

模型漂移与性能下降

实时推理数据中出现的偏见

数据管道异常与血缘断裂

新监管指引触发的策略违规

HPE将可观测性原生集成到其AI/ML平台中，包括支持 MLflow、Kubeflow，以及在HPE Cray和HPE ProLiant平台上运行的HPE专有监控代理。告警不仅限于技术层面，还映射到业务风险阈值，一旦超出设定边界，将自动升级至治理责任人。

支柱四：每一层都有人为问责

技术支撑治理，但人为问责才是治理的保障。HPE在企业内部建立了分层AI问责模型，在三个层级明确责任归属：

表1. HPE企业AI问责模型——定义战略、运营与职能层面的治理责任

层级

责任人

职责

战略层

首席AI官 / 董事会

AI伦理政策、监管策略与企业风险偏好

运营层

AI平台团队/MLOps

模型治理、流程完整性、性能服务等级协议（SLA）

职能层

业务单元AI负责人

用例审批、利益相关方沟通与成果衡量

欧盟AI法案：HPE的实用合规指南

欧盟AI法案代表了全球最全面的强制性AI法规，正在重塑全球企业的AI战略。HPE投入大量资源帮助客户及自身运营为合规做好准备。

HPE的合规方法围绕三项运营举措展开：

举措一：AI系统清单与风险分类

合规的前提是可见性。GreenLake AI目录功能使企业能够发现、分类并维护所有运行中AI系统的可审计清单。风险等级由治理责任人审核确认。

举措二：符合性评估准备

对于高风险AI系统，欧盟AI法案要求提供文档化的符合性评估。HPE提供预置的评估模板，降低受监管行业的合规负担。

举措三：持续性法规监控

AI法规并非一成不变。HPE治理平台包含法规情报推送功能，能够主动调整，而非被动应对。

AI与可持续性：能源问责治理

AI工作负载是高能耗计算任务之一。HPE认为，AI治理必须包含环境治理。

GreenLake提供AI训练与推理运行的每个工作负载能耗指标

液冷HPE Cray超级计算平台在大模型训练中提供业界领先的每瓦性能

HPE内部AI基础设施在计算预算中应用碳核算

使用HPE AI基础设施的客户可获得与GHG Protocol Scope 3类别对齐的碳排放报告

HPE洞察：可持续AI不是与性能的权衡取舍，而是一项治理要求。

HPE设计的AI基础设施，将能源问责内置于其中。我们的EnergyAware平台让AI的碳排放成本与资金成本一样清晰可见。

HPE AIOps赋能AI信任落地

HPE开发了一套内部框架——HPE AIOps框架，将我们在企业及客户环境中构建、部署、监控和退役AI系统的方式系统化。该框架包含五个运营阶段：

评估：在模型开发启动前，定义风险画像、监管义务与成功指标

构建：使用经过批准的数据管道开发模型，确保血缘可追踪、公平性测试与版本控制

验证：在部署前对准确性、偏见、鲁棒性与可解释性等维度进行评估

部署：上线发布，集成可观测性、回滚能力与人工升级路径

治理：持续监控模型行为，自动化合规检查，管理模型直至退役的全生命周期

这一框架已嵌入我们的HPE机器学习开发环境（MLDE），作为受管控的端到端AI开发平台提供给企业客户。

开放共赢：以合作伙伴生态，拓展AI治理边界

没有任何单一供应商能够提供全面的AI治理。HPE的方法以生态为导向。我们的治理能力与以下平台集成：

NVIDIA AI Enterprise，用于具备

← 上一篇：深圳觉知生命AI公司招聘资深后端工程师下一篇：贵阳成功举办AI+品牌增长专题培训 →