OceanBase掌门人杨冰:AI浪潮催生基础软件重定义契机
日前,OceanBase首席执行官杨冰撰文《AI浪潮催生基础软件重定义契机》。文中强调,随着大模型功能日趋同质化,AI竞赛的重心已从“哪家模型更胜一筹”转向“谁能助力AI深度理解业务”,数据库因此被推向AI基础设施的关键地位。
杨冰表示,AI数据库并非对旧有产品的细微改良,而是底层基础设施的彻底重塑——中国首次迎来从基础软件规范“跟跑者”跃升为“共创定义者”的机遇。
完整内容如下:
人工智能正重新塑造基础设施,数据底座作为AI新型架构的关键环节,其战略意义正逐渐被重视。当各家大模型的通用本领日益趋同,竞争的焦点正从“哪家模型更强”,转向“谁能令AI真切领悟业务、将成效落到实处”,市场由此亟需全新的“AI数据库”。
作为国内专注自主创新的数据库企业,伴随AI开启新篇章,我们得以与海外同行并肩起跑,以自身路径界定和打造AI数据库的体系。对中国的基础软件行业而言,这是一份值得把握的宝贵契机。
AI重塑基础设施,数据库将居中枢地位
回顾信息技术演进历程,每一次运算范式的跨越都伴随着底层设施的革新。当前AI技术的飞速发展,也在加速推动新型基础设施的重塑。
在这套体系中,除算力、能源等关键要素外,与数据紧密相连的数据库也必将占据要位。
数据库产业的演进史,正是信息技术新需求不断萌生的历程。个人计算机时代确立了关系型数据库,互联网时代催生出分布式与开源数据库,移动与云计算时代改写了数据存储与运算模式。每一个时代,数据库都是不可或缺的关键基础软件。
AI时代同样如此。模型划定了AI的能力疆域,而数据则决定了AI的业务实效。通用大模型或许“博闻广识”,却未必洞悉“这一家企业”的经营逻辑。使AI从“样样粗通”迈向“真切懂我”,依赖的是高质量的数据与场景背景。AI落地的“最后关口”,本质上是一道数据工程的挑战。
AI时代数据库需回应崭新的时代课题
每个时代的数据库,都是顺应时代需求的基础软件。AI数据库应是数据底座的一次重塑,而非对旧时代产品的简易修补。AI数据库绝非“传统数据库外加一个向量扩展”那般浅显,它需重新解答一个核心问题:在一个由AI主导的世界中,数据应如何被编排、被认知、被调度?
过去数十年,数据库服务的始终是人:由人撰写查询、由人阅览报表、由人作出决断。而如今,一个深刻的转变正在上演——数据库首次迎来非人类的用户:智能体(Agent)。据行业预估,到2028年,将有约三分之一的企业软件交互由智能体完成。智能体观察世界的角度,与人迥然不同。人惯于二维表格,而智能体需求的是一个完备的多模态天地。这一点,正是AI数据库有别于传统数据库的本质所在。
智能体的登场意味着数据库需原生承载三项核心能力:上下文,即精确供给信息,让智能体回应精准;规模,即在极低成本下支撑千万级智能体的独立数据空间;进化,即提供安全环境让智能体持续迭代成长。三者系统化融合,构成了AI原生的数据底座。
与此同时,全球超八成的数据是文本、图像、音视频等非结构化数据,过去因机器难以解读而长期沉寂,人工智能首次令它们变得“可运算”,从企业的“废弃物”升格为核心资产。搜索是智能体天然的行为方式,非结构化数据须与结构化数据在同一底座上被统一管治和检索;数据要构成“数据飞轮”,实时在线供给模型、模型驱动智能体,愈用愈准;自然语言成为智能体与数据库交互的全新入口。
这一切指向一个结论:真正的AI数据库,必须将多种数据形态统一在同一套引擎中处置。而“湖库一体”正是能支撑此需求的架构。它并非简单地将数据库与数据湖并置,而是AI时代数据底座的一次重构,把数据湖开放、海量存储的特性,数据库事务、分析与实时处理的本领,以及AI所需的多模态理解、语义检索、模型调用等智能数据能力,统一至同一个强一致的数据底座之上,从架构层面消解AI应用落地中的系统繁复。
重塑并非全盘摒弃。需重写的是架构与类别;必须恪守的是工程的底线——一致性、扩展性、可靠性、实时性,在AI时代变得前所未有地关键。
基础软件面临重新界定的重大机遇
数据库作为我国重点攻坚的核心基础软件,长期被欧美少数企业把持。分布式数据库时代,以OceanBase(海扬数据库)等为代表的国产自研分布式数据库开始实现弯道超越。2019年和2020年,在被誉为“数据库领域世界杯”的TPC-C和TPC-H基准评测中,OceanBase两度登顶世界纪录,冲破了海外垄断。这些历程印证,我们完全具备在基础软件赛道上实现突围的能力。
当下AI浪潮正在重塑数据库产业,这次我们有幸站在了与海外科技企业等同的起跑线上。以往国产核心软件突破艰难,一个重要缘由是只能在他人制定的规范下寻求突围。而如今,我们有机会在AI数据库等范畴,率先确立新的规范和标准。这意味着,我们首次有机会从基础软件规范的“跟随者”,蜕变为“共同定义者”。
从国际到国内,数据库行业正凝聚一个共识:AI时代需要一种崭新的数据底座。真正的分歧不在于“是否要变”,而在于“如何变”。我们坚信,AI数据库必然不是被动适配AI,而是主动重塑AI时代的数据底座——以一个“湖库一体”的AI数据库,回应智能体、多模数据与更高底线带来的崭新命题。
这并非单一企业的技术路径抉择。谁能率先洞悉AI时代的数据法则,并将其转化为可用的基础设施,谁就能达成在基础软件领域的自主与领先。(作者系海扬数据库首席执行官)
(注:此文属于央广网刊载的商业资讯,文章内容不代表本网立场,仅供参考。)