标签

OpenAI新模型限制开放,企业为何不能全面解锁AI?

发布时间:2026-06-28 08:51阅读:5

AI越强大,越不能随意开放;越能干活,越要分级管理。

公司为所有员工开通了最先进的AI模型。

起初,大家都觉得效率提升了。文员用它写会议纪要,运营用它做活动方案,财务用它分析表格,技术人员用它查代码漏洞。

直到运营把AI生成的活动方案直接发给客户——其中一段优惠条款没经过核实。财务将内部经营数据输入了不该用的模型。技术人员让AI生成了一段可直接执行的脚本,却没人知道它会修改哪些文件。

问题不是员工不会用AI,而是公司把不同风险等级的任务都交给了同一个入口。

就在昨天,OpenAI发布了GPT-5.6系列。最值得注意的是模型更强了,而是它没有直接开放。

据Axios报道,首发仅约20家公司参与。全球最前沿的AI模型只给了少数客户先用。OpenAI官方给出了模型分层:Sol、Terra、Luna,三个能力等级,对应不同的智能、速度和成本。Help Center也明确写着:这是一次limited preview,不是自助服务——仅限少数受信任的合作伙伴,没有公开申请入口,完成注册也不等于获得权限,访问可能分批启用。Guardian则披露,政府要求预览期“逐客户审批访问权限”。

合在一起看,这不是一次普通模型发布,而是一次“受控放行”。连OpenAI自己都在做分级、限量、受控——企业凭什么一键全员开放?

场景决定风险,风险决定权限,权限决定模型,模型输出还要过闸门。

这是企业AI放行的四道闸,也是管理者明天就能用的操作流程。

很多公司按部门分配AI权限:市场部用这个,技术部用那个,财务部再配一个。但同一个部门里,写一封内部邮件和签一份对外合同,风险完全不同。

真正该问的不是“你是哪个部门的”,而是“这件事如果AI搞错了,你能不能撤回来”。

能撤回来的,是低风险。写会议摘要、改一版文案、整理一份资料清单——错了改掉就行,影响范围可控。

撤不回来的,是高风险。客户承诺、合同条款、财务分析、代码执行、漏洞扫描——这些东西一旦出错,要么造成直接损失,要么引发合规风险,要么两者兼有。GPT-5.6 Sol这次的网络安全能力就是一个信号:它在网络安全任务上明显更强。OpenAI提到,GPT-5.6 Sol没有跨过Cyber Critical阈值,但已经能识别漏洞和利用原语。方向已经很清楚了——AI正在进入“错了就收不回来”的领域。

中间地带怎么办?给一个最简单的判断标准:这个AI输出会不会被公司以外的人看到,或者会不会直接改变业务系统的状态?同样是写文案,发在内部群里只是低风险,发到公众号、客户群或销售页面上,就变成高风险——因为外人一旦看到,撤回成本就不一样了。如果会,按高风险处理。如果不会,按低风险放行。

场景定完了,才轮到人。

场景的风险等级定了,接下来要回答的是:谁有资格让AI进入这个场景?

很多公司按职级分权限——总监比经理多一个模型,经理比员工多一个功能。但这套逻辑在AI时代会失灵。因为问题不是“这个人级别够不够”,而是“这个人能不能为AI在这个场景下的输出负责”。

一个运营专员可以用AI写活动文案,因为文案出问题,他能负责——改掉就行。但同样是这个运营专员,如果让AI直接生成客户承诺条款并发出去,他负责不了——因为后果超出了他的决策权限。

OpenAI这次的做法值得参考。Help Center写得很清楚:limited preview不是自助服务,仅限受信任的合作伙伴;API和Codex分开审批,拿到一个不等于拿到另一个;完成注册不等于获得权限,访问可能分批启用。换句话说,OpenAI不是按“你多大公司”给权限,而是按“你要干什么”和“你能不能管住”来分。

企业内部也该如此。不是按职级分,而是按责任分:普通员工是使用者,可以用AI辅助表达和整理;业务负责人是授权者,可以决定AI在哪些业务场景中启用;技术管理员是守门者,控制AI能访问哪些系统和数据;审批人是最后一道关,对高风险输出签字确认。

权限跟着责任走,不跟着职级走。

人定了,接下来才是工具。

第二道闸管的是“人能不能碰”,这道闸管的是“碰的时候给他什么工具”。

同样是财务分析,财务专员用基础模型整理表格就够了——快、便宜、够用;财务负责人用强模型做经营分析,需要更深度的推理,但数据访问和工具调用必须受控;涉及预算决策和外部披露的,不仅要限制数据范围,还要限制输出能不能离开系统。如果财务专员拿强模型做深度经营分析,模型又能自动调用外部数据源、读取历史文件,他可能根本不知道模型碰过哪些数据、生成结论时用了哪些前提。

这不是过度谨慎,而是成本和风险的双重要求。OpenAI自己就在做这件事。GPT-5.6系列分了三层:Sol是旗舰模型,能力最强;Terra是平衡型,兼顾性能和效率;Luna是快速低成本模型。价格上,Sol每百万token输入5美元、输出30美元,Terra减半,Luna更低。官方的说法是,给用户在智能、速度和成本之间更清晰的选择。

翻译成企业语言就是:不是所有任务都值得用最贵的模型,也不是所有任务都该用最聪明的模型。低风险场景用快模型,省成本、提速度;高风险场景用强模型,但要加约束——限制它能调用的工具、能访问的数据、能输出的格式。AI能力从“回答问题”进化到“自主执行复杂任务”——GPT-5.6 Sol的ultra多子代理模式就是信号——AI越能自己干活,你就越要控制它干活时能碰到什么。

模型选对了,最后一道闸才是关键。

前三道闸管的是输入端:谁、在什么场景、用什么模型。但最容易出事的地方,不在输入端,而在输出端。

因为AI生成的东西,看起来太像“成品”了。

一份活动方案,格式工整、逻辑通顺、语气专业——运营觉得没问题,直接发给客户。一份财务分析,数据齐全、图表清晰、结论明确——领导觉得可以,直接写进汇报材料。一段代码,跑得通、改了bug——技术人员觉得行了,直接提交到生产环境。

问题在于:AI输出的“像成品”,和“是成品”之间,差了一道人工确认。

管理者最容易犯的错,不是选错了模型,而是让AI输出直接进入业务流。自动发客户、自动改文件、自动提交审批、自动生成合同条款——这些动作一旦执行,撤不回来。

怎么设这道闸?按输出后果分三档:

低风险输出,可以直接用。

会议摘要、内部邮件、文案初稿——错了改掉就行,不影响外部、不改变系统。

高风险输出,必须人工确认。

客户方案、经营分析、对外报告——必须有人看过、签过字,才能流转到下一步。不是不信任AI,而是这个环节的后果,AI承担不了。

敏感输出,不能从生成直接跳到执行。

涉及钱、客户、合同、代码、安全的——AI可以生成,但必须经过审批流程,由有权限的人确认后才能执行。

OpenAI自己的安全安排,本质上也是这套逻辑:不是让模型生成什么都直接放出去,而是在高风险环节保留暂停、审查和拒绝的机制。企业不需要做到OpenAI那个级别,但逻辑是一样的:AI生成和业务执行之间,必须有人把关。

四道闸走完,回到开头那个场景。运营方案能不能直接发客户,先看它是不是对外承诺;财务数据能不能丢进模型,先看它是不是敏感经营信息;技术脚本能不能执行,先看它会不会改变系统状态。

这就是分级放行的价值:不是让AI变慢,而是让不同风险的任务走不同的路。

场景决定风险,风险决定权限,权限决定模型,模型输出还要过闸门。

GPT-5.6 Sol的限量放行,给管理者提了一个醒:当AI能力越来越强,管理的重点已经不是“让更多人用上AI”,而是“决定谁能在什么场景下用到什么程度”。

明天就可以做一件事

把公司现有AI使用场景拉出来,按“错了能不能撤回来”分成三类——能撤回、难撤回、撤不回。分完你就会知道,哪些场景可以继续开放,哪些场景必须加闸。

参考