标签

HPE的人工智能治理之路:从概念到实践

发布时间:2026-04-03 17:36来源:微信阅读:8

HPE借助混合基础设施、AI可观测性和全生命周期管理,将人工智能治理转化为实际操作,帮助企业大规模部署负责任的AI系统。

人工智能已不再是企业未来规划中的概念,它已在生产环境中运行,做出关键决策,并影响业务的各个方面。当前企业面临的挑战是如何负责任地、大规模地管理和运营AI,以实现可衡量的效果。

在HPE,我们不仅制定AI政策框架,还将其转化为具体实践,融入基础设施、工作流程和企业文化中。本文将分享我们的实践经验,以及这对身处AI时代的企业为何至关重要。

01

从AI原则到AI运营:填补治理差距

许多企业发布了AI准则,但真正能构建运营体系来执行这些准则的企业却很少。HPE将这一差距称为“治理鸿沟”,即声明的AI价值观与模型在部署、再训练或退役时实际发生的情况之间的差异。

填补这一鸿沟需要我们将AI治理视为一门运营学科,配备专门的工具、指标、责任主体和反馈机制,而不仅仅是一项法律或合规职能。

HPE观点: AI治理必须嵌入机器学习运营(MLOps)流程中,而非独立存在。

HPE生产环境中的每个模型都有明确的责任人、风险分类、数据血缘记录和自动化监控策略,这些均通过HPE AIOps框架进行管理。

02

HPE AI治理实践四大支柱

支柱一:负责任AI设计

HPE将负责任AI准则嵌入模型设计阶段,而非事后审核。这意味着,在编写任何模型代码之前,每项AI计划都要经过结构化的AI影响评估。该评估涵盖:

训练数据与决策输出中潜在的偏见风险

监管适用性(GDPR、欧盟AI法案、美国AI行政令)

高风险决策中的人机协同要求

基于最终用户场景的可解释性要求

HPE与开放标准企业的合作,包括对NIST AI风险管理框架的贡献,反映了我们的信念:治理应该是行业性的,而非专有的。

支柱二:实现AI管控的混合基础设施

没有基础设施管控的治理只能是愿景。HPE的“混合设计”理念使企业能够根据数据主权、延迟和合规要求,灵活选择AI工作负载的运行位置。

通过GreenLake,客户获得了一个统一的AI基础设施控制平面。这意味着:

跨异构AI环境的集中化策略执行

遵守特定辖区法规的数据驻留控制

不牺牲治理连续性的工作负载可移植性

与可持续发展目标对齐的实时资源分配

关键差异化优势: 与超大规模优先的策略不同,HPE的混合模式确保治理策略跟随工作负载,而非相反。企业在保持云灵活性的同时,仍能控制AI技术栈。

支柱三:AI可观测性与持续合规

模型部署只是治理旅程的开始。HPE通过AI可观测性将持续合规落地为实践,这是一套用于监控生产环境中模型表现的实践与工具,涵盖:

模型漂移与性能下降

实时推理数据中出现的偏见

数据管道异常与血缘断裂

新监管指引触发的策略违规

HPE将可观测性原生集成到其AI/ML平台中,包括支持 MLflow、Kubeflow,以及在HPE Cray和HPE ProLiant平台上运行的HPE专有监控代理。告警不仅限于技术层面,还映射到业务风险阈值,一旦超出设定边界,将自动升级至治理责任人。

支柱四:每一层都有人为问责

技术支撑治理,但人为问责才是治理的保障。HPE在企业内部建立了分层AI问责模型,在三个层级明确责任归属:

表1. HPE企业AI问责模型——定义战略、运营与职能层面的治理责任

层级

责任人

职责

战略层

首席AI官 / 董事会

AI伦理政策、监管策略与企业风险偏好

运营层

AI平台团队/MLOps

模型治理、流程完整性、性能服务等级协议(SLA)

职能层

业务单元AI负责人

用例审批、利益相关方沟通与成果衡量

03

欧盟AI法案:HPE的实用合规指南

欧盟AI法案代表了全球最全面的强制性AI法规,正在重塑全球企业的AI战略。HPE投入大量资源帮助客户及自身运营为合规做好准备。

HPE的合规方法围绕三项运营举措展开:

举措一:AI系统清单与风险分类

合规的前提是可见性。GreenLake AI目录功能使企业能够发现、分类并维护所有运行中AI系统的可审计清单。风险等级由治理责任人审核确认。

举措二:符合性评估准备

对于高风险AI系统,欧盟AI法案要求提供文档化的符合性评估。HPE提供预置的评估模板,降低受监管行业的合规负担。

举措三:持续性法规监控

AI法规并非一成不变。HPE治理平台包含法规情报推送功能,能够主动调整,而非被动应对。

04

AI与可持续性:能源问责治理

AI工作负载是高能耗计算任务之一。HPE认为,AI治理必须包含环境治理。

GreenLake提供AI训练与推理运行的每个工作负载能耗指标

液冷HPE Cray超级计算平台在大模型训练中提供业界领先的每瓦性能

HPE内部AI基础设施在计算预算中应用碳核算

使用HPE AI基础设施的客户可获得与GHG Protocol Scope 3类别对齐的碳排放报告

HPE洞察:可持续AI不是与性能的权衡取舍,而是一项治理要求。

HPE设计的AI基础设施,将能源问责内置于其中。我们的EnergyAware平台让AI的碳排放成本与资金成本一样清晰可见。

05

HPE AIOps赋能AI信任落地

HPE开发了一套内部框架——HPE AIOps框架,将我们在企业及客户环境中构建、部署、监控和退役AI系统的方式系统化。该框架包含五个运营阶段:

评估: 在模型开发启动前,定义风险画像、监管义务与成功指标

构建: 使用经过批准的数据管道开发模型,确保血缘可追踪、公平性测试与版本控制

验证: 在部署前对准确性、偏见、鲁棒性与可解释性等维度进行评估

部署: 上线发布,集成可观测性、回滚能力与人工升级路径

治理: 持续监控模型行为,自动化合规检查,管理模型直至退役的全生命周期

这一框架已嵌入我们的HPE机器学习开发环境(MLDE),作为受管控的端到端AI开发平台提供给企业客户。

06

开放共赢:以合作伙伴生态,拓展AI治理边界

没有任何单一供应商能够提供全面的AI治理。HPE的方法以生态为导向。我们的治理能力与以下平台集成:

NVIDIA AI Enterprise,用于具备