AI 的未来:闭源与开源的共存之道
近几年来,关于人工智能发展方向的讨论中,一个问题始终备受关注:
人工智能的未来,究竟会走向开源,抑或是被闭源所主导?
这个问题表面上看是在探讨技术路径,实则触及了权力分配、商业模式的演变、创新的步伐以及信任机制的构建等深层议题。
如果必须给出一个简短的答案,我的判断是:
人工智能的发展不会是单一的开源模式,也不会被闭源技术完全垄断。未来的格局将呈现双轨并行:闭源模式将定义能力的上限,而开源模式将决定其普及的速度。
这或许听起来像是一种折衷的观点,但其背后蕴含的是一场更深刻的变革:人工智能正从单纯的“模型竞赛”演变为“应用与基础设施的竞赛”。
最尖端的大型模型,大概率在相当长一段时间内将以闭源形式为主导。
其原因并不复杂。训练一个顶级的模型需要海量的计算资源、庞大的数据集、精密的工程团队、严谨的安全评估以及强大的产品分发能力。这早已超越了几个研究人员在实验室中就能完成的范畴,而是一项高度资本密集、组织密集、基础设施密集型的庞大工程。
闭源公司的优势在于,它们能够将模型、产品、计算能力、商业化运作以及安全控制整合在一个统一的体系中进行推进。
像OpenAI、Google、Anthropic、xAI等公司所做的,不仅仅是“训练一个模型”,而是在构建一套完整的AI操作系统,这包括模型本身、API接口、智能体、办公软件入口、浏览器、编程工具、企业级服务、支付系统以及开发者平台等。
这也是为何最强大的模型往往首先以闭源的形式出现。
闭源模型的目的并非让所有人都能窥探其内部权重,而是让更多用户能够借助其完成各项任务。
它所追求的是能力的强大、系统的稳定、商业上的闭环以及风险的有效控制。
然而,如果认为闭源将统治一切,那无疑是低估了开源的力量。
开源的力量可能并不在于永远站在技术的最前沿,而在于能够将能力迅速、广泛地扩散到各种不同的应用场景之中。
企业为何青睐开源模型?
这是因为它们具备可控性、易部署性、易微调性、易审计性,并且更容易与企业内部的现有系统进行集成。
对于许多公司而言,它们未必需要最顶尖的通用模型。在诸如客户服务、知识库管理、合同分析、质量检测、文本翻译、数据处理、内容创作以及内部助手等场景中,成本、稳定性、数据隐私以及可定制性往往是更为重要的考量因素。
一个性能略逊但成本更低、更可控且支持本地部署的模型,可能比一个性能最强但价格昂贵、封闭且难以掌控的模型,更适合实际的生产环境。
尤其是在金融、政务、医疗、制造、教育等对数据安全和合规性要求极高的行业,开源或开放权重模型将具备天然的优势。
开源的意义并非要“击败所有闭源模型”,而是致力于让人工智能真正成为一种基础设施。
如今,许多人讨论人工智能时,仍然习惯性地将注意力集中在模型性能的排行榜上:
哪个模型的数学能力更强? 哪个模型的代码生成能力更优? 哪个模型的多模态处理能力更出色? 哪个模型的上下文理解能力更长?
这些方面固然重要,但未来真正决定价值的,可能并非模型本身,而是模型能否有效地嵌入到实际的工作流程中。
人工智能发展的下一个阶段,将不再是仅仅“更会聊天”,而是要“更会做事”。
它需要能够理解任务指令、调用外部工具、操作各种软件、读写文件、连接数据库、处理表格数据、发送电子邮件、编写代码、生成报告,甚至能够持续地跟踪一个复杂项目。
这就是为何“智能体”(Agent)正在成为当前的主流焦点。
当人工智能的角色从简单的“回答问题”转变为“执行任务”,竞争的重心也随之发生改变。
过去,竞争的焦点在于模型参数的规模、训练数据的质量以及基准测试的表现。而未来,竞争的重点将转移到:
谁拥有用户入口? 谁掌握了丰富的业务场景? 谁能够有效地连接各种工具? 谁能有效控制成本? 谁能确保系统的安全性和可靠性? 谁能将AI真正融入到日常的真实工作中?
模型仅仅是驱动引擎,而整辆车(产品或服务)才是真正产生价值的载体。
未来的AI生态系统,很可能并非一方完全取代另一方,而是形成一种明确的分工。
闭源模型将负责探索能力的边界。它们将承担最艰巨、最复杂、成本最高的任务,例如前沿科学研究、复杂的代码工程、多步骤的智能体协作、跨模态的深度理解以及企业级的自动化解决方案。
开源模型则将致力于实现能力的规模化落地。它们将渗透到本地设备、私有云、行业专用系统、边缘计算以及大量的垂直细分场景中。
一个企业的AI架构,很可能将是混合式的:
简单的任务可能选用本地部署的小型模型。 涉及敏感数据的任务则使用私有云部署的模型。 需要进行复杂推理的任务可以调用闭源的大型模型。 高频使用的场景可以利用开源模型来降低成本。 关键决策的制定则可能采用多模型交叉验证的方式。
这并非一种理论上的理想化设计,而是由成本、隐私、性能和合规性等多重现实因素共同推动的选择。
会,也不会。
“会”追赶上,是因为开源社区的传播和发展速度极其迅猛。许多闭源模型刚刚展示出某种新能力,几个月后,开源模型就能迅速逼近,甚至在某些特定任务上超越它们。
“不会”完全追赶上,是因为最前沿模型背后所需的投入正变得越来越惊人。算力、电力、数据中心、芯片供应以及顶尖研究团队等资源高度集中。最强大的闭源模型仍然会拥有一定的时间窗口优势。
因此,更可能出现的格局是:
闭源模型在一段时间内保持领先,而开源模型则快速追赶并使得旧有的能力变得大众化(commoditize)。
换句话说,闭源模型创造附加价值,而开源模型则不断降低价格。
这将导致AI的能力成本持续下降,同时也使得单纯依靠销售模型本身变得越来越困难。
如果AI能力持续扩散,模型本身将越来越类似于云计算、数据库、支付系统或地图服务,成为一种基础性的能力。
真正的商业价值,将逐渐向上层应用迁移。
谁能掌握用户入口,谁就拥有优势。 谁能掌握行业数据,谁就拥有优势。 谁能改造现有的工作流程,谁就拥有优势。 谁能将AI无缝地融入到产品体验中,谁就拥有优势。
未来的赢家,未必是那些“模型最强”的公司,而是那些最了解应用场景、最擅长分发渠道、最懂得提升组织效率的公司。
这对创业者和普通公司而言,反而是一个积极的消息。
因为你可能并不需要从头开始训练一个基础大模型。你真正需要思考的是:
在我的业务中,哪些环节可以通过AI进行重塑? 哪些流程可以从“人工操作软件”转变为“由人定义目标,AI负责执行任务”? 哪些数据和经验,是通用模型难以轻易获取并模仿的? 我能否将这些转化为自身的竞争壁垒?
所以,人工智能的未来并非简单的开源或闭源之争。
闭源模式将持续推高能力的上限。 开源模式将不断降低应用成本。 而真正的战场,将从模型本身转移到真实世界的任务、工作流程和组织结构上。
在未来的几年里,我们将目睹一个非常有趣的局面:
最顶尖的AI能力可能源自闭源公司。 最广泛的AI应用可能来自开源生态。 而最具价值的AI,则将体现在那些真正能够改变人们工作方式的产品之中。
换而言之:
闭源决定了AI能够做到什么。 开源决定了有多少人能够负担得起并使用AI。 而最终决定胜负的关键,在于谁能成功地将AI融入到实际的工作场景中。