腾讯AI Lab十年演进:从学术高地到产业落地的转型之路
作者丨成仲轩 梁丙鉴
2015年,腾讯总裁刘炽平从李嘉诚家族等人士处,首次获悉DeepMind的存在——一家当时尚未引起大众关注的AI企业。
鲜有人知的是,这条线索的源头,隐藏在一段华裔血脉之中。
DeepMind创始人兼CEO Demis Hassabis的母亲是新加坡华人,Demis与香港投资圈也有着密切联系。
实际上,李嘉诚本人就是DeepMind的LP,他坦言"能参与DeepMind早期投资是珍贵的缘分"。
借助香港资本圈的这层关系,刘炽平得知DeepMind正在秘密研发一款划时代的围棋AI。渴望在腾讯内部建立全新AI研究机构的他,迅速派遣腾讯技术高管、时任副总裁的姚星等人,远赴英国向Demis取经。
2016年前后,姚星三度飞往英国,目的十分明确——"以棋会友"。
论起围棋,姚星在野狐围棋上达到业余六段,并非弱者。但他拜访的这位"棋手"更为不凡:先是私下5:0完胜欧洲围棋冠军、职业二段的樊麾,随后又击败两位世界冠军。
如今,这位棋手的身份不难猜出,它就是AlphaGo。
当时与Demis往来日益频繁的姚星,回国后也将这套深度学习框架带回腾讯,让公司的"内部搜索"团队(又称"内搜")先从象棋AI入手研发。没想到,团队却直接瞄准围棋AI,仅用两周就拿出了版本,与姚星本人对弈。
AI虽然强大,但姚星在棋力上也不落下风,与AI展开对弈,竟能略胜一筹。这个围棋AI虽然还不及业界前沿,但的确展现出了一些"灵性"。
这样的成果,也让姚星在公司内部组建AI前沿团队变得顺畅许多——同一时期,一个名叫AI Lab的组织在腾讯诞生,此后十年,成为腾讯AI研究的核心力量。
在腾讯,一个属于AI的全新时代已然开启。
腾讯的AI Lab起步,应从2016年算起,比百度引入吴恩达、Geoffrey Hinton加入谷歌还晚了好几年。
回顾腾讯AI Lab的早期架构,在TEG总裁卢山和院长姚星之下,是主任张潼、副主任俞栋,以及NLP、视觉、机器学习、语音四个中心,分别负责四个方向,从史树明、刘威,到黄俊洲、黄志恒等中心总监级别的人物,都是姚星亲自面试。
关于最早期的AI Lab"三剑客"——张潼、俞栋和刘威,先前在Lab工作的同事华胜向雷峰网分享了一则趣事:张潼和俞栋作为正副主任在Lab的主页上自然更靠前,而刘威则因为上传照片更早,得以成为"三剑客"之一,实际上与不少人算是同期加入AI Lab。
随后不久,张潼又引荐了一位名叫刘晗的人加入AI Lab,新设了一个中心——于是,最早期AI Lab五个中心的架构正式形成,每个中心HC在10人左右,算上支持团队,共计不过60-70人。
在AI Lab之外,姚星又在TEG内部设立了"AI平台部",前身即前文提到的"内搜"团队。这个团队最早从事腾讯的"搜搜"业务,后来"搜搜"被卖给搜狗后,团队仍留下部分人员,在腾讯内部提供搜索技术支持。
AI平台部本身也归属姚星负责,但姚的主要精力更多集中在AI Lab上,平台部最早由后来创业"超参数"的刘永升(公司内人称"卡卡")牵头,后来在混元大战中崭露头角的王迪、如今主管游戏AI业务的杨巍,都是AI平台部的老将。
在与AI Lab的合作上,AI平台部更倾向于为NLP业务提供工程支持,因此Lab的NLP中心工程人员招入不多;而到了视觉、语音等方向,Lab也渐渐开始扩招工程人员,编制也逐渐扩大。
早期,AI Lab的人数慢慢扩张到100人左右,当时的AI平台部则有约300人,两边虽然对内分属不同组织,但对外都自称腾讯"AI Lab"。
张潼时代,姚星虽然不直接管理AI Lab,但对Lab方向的掌控仍有拍板权——他自己组织例会、也与张潼共同出席,接受各中心的汇报,事必躬亲。在Lab,脾气直爽的姚星"批评"过不少人,但下属对他的评价却一致很高,把他视为一位直接但务实的领导。
另一边,张潼虽然是AI Lab的主任,但他的兴趣更多在学术上,相比管理,他更专注于自己的研究,颇有几分世外高人的风范。
在AI Lab初创的那几年,因为人工智能也刚刚兴起,腾讯给予了AI Lab充分的科研自由,后者可以专注提升自己的学术影响力。据说,为了招揽张潼,腾讯甚至开出"五年不考核业绩"的条件,即AI Lab在其治下的前五年可以"只花钱不挣钱",且承诺在此期间不淘汰任何成员。
在张潼之下,几个中心也分头探索,自由度很高。
在成立早期,姚星亲自为AI Lab设定了一个"目标":学术有影响,工业有产出。这两点也一直是AI Lab团队和员工晋升的考核方向:答辩时,不仅看发了多少论文、参加了多少顶会;还要看对于公司的实际业务做出了哪些实质性的贡献。
在之前的《我为什么支持BAT拆掉「AI研究院」》一文中,雷峰网就深度分析过,AI研究院的架构与业务团队的"不清不楚",就容易导致前沿探索和工业产出脱节。这个问题,也延伸到了后面腾讯AI Lab和优图实验室的竞争当中,不过这里先按下不谈,后文再着墨细谈。
而张潼时代的结束,根本原因也是学术和工业两端的拉扯。事实上,在张潼时代,AI Lab的产出更多聚焦于Tencent ML-Images等开源数据集和论文的贡献上,显然以基础研究为重。期间虽有围棋AI绝艺一鸣惊人,但终究没有成长为商业化的产品。
而在学术和工程的拉扯中,受影响严重的,是被张潼招进AI Lab的刘晗。
刘晗
在AI Lab,刘晗是机器学习中心的负责人,研究方向与张潼一脉相承;同时,刘晗也有很深的学术背景,曾在普林斯顿大学和约翰霍普金斯大学执教,还拥有美国西北大学的终身教职,与横跨学界和大厂的张潼也有着相似的过往,也是张潼在来到腾讯之前的旧识。
然而,在对刘晗的看法上,张潼和姚星却逐渐产生了一些分歧——机器学习理论固然重要,但在一些旁观者看来,刘晗采用的研究方法,却更似在高校,不似在大厂。这种身份的调转,绝不是刘晗一人的难处,体现的是同时期学术和工业界融合时,不少人的共性难题。
如此,刘晗没过多久,便离开了AI Lab。这件事,对于张潼随后的离职也有着不小的影响。
在AI Lab,张潼的位置比起"主任",更像一个"首席科学家",他不仅自己就是一支技术探索的先锋军,更是一块学术圈的金字招牌。在当时AI Lab的Slogan当中,"学术有影响"要排在"工业有产出"之前,这也是当时Lab整体方向设计的一个缩影。
在AI Lab的不少老员工看来,姚星对于张潼的期待,是让张潼少做一些管理,而是发挥他的强项,做技术的最高负责人——然而,这样的定位,也和"AI Lab主任"的名头实际不符。
一位草创期便在Lab工作的员工表示道,在采取实际动作让张潼交出管理权之前,姚星就已经和几个中心的负责人聊过,获得了大家的支持。
而后来的张正友,则深知自己前任的困境,用更深入的姿态参与到AI Lab的工业产出和人事管理当中,这也是后话,我们马上就谈。
于是,在来到腾讯一年多之后,张潼也离开了腾讯。刚刚提到的AI Lab初创曾和雷峰网分享到,学术天赋极高的张潼最善数学,在公司常常能看到他订下一个会议室,在里面和实习生推算公式,一推就是一天——张潼的个性,也可见一斑。
2018年3月,姚星主导成立了Robotics X实验室,使腾讯成为最早布局具身智能赛道的大厂之一。张正友也是此时被卢山和姚星招入,以Robotics X主任的身份,加入了腾讯。
张潼表露去意后,副主任俞栋,最早才是AI Lab主任的第一顺位人选。但彼时的他正担任腾讯西雅图AI实验室的总负责人,不愿离开,并向公司推荐了张正友。巧合的是,张正友也是张潼的推荐人选。
面对姚星的盛情邀请,张正友表示自己更感兴趣的其实是Robotics X。对此,腾讯的回应是双倍offer,Robotics X和AI Lab兼管,并承诺在AI Lab不设KPI,让张正友能更顺利地完成和AI Lab组织的融合。
不同于张潼,来自微软研究院的张正友,在工业界的经验更加丰富,有很强的工程落地眼光,亦有很强的管理能力与意愿——这也恰好与姚星彼时的着眼点不谋而合。
"正友老师就像一座桥梁,连接了学术界与产业界,让AI Lab走向了一个新时代。"另一位前AI Lab成员补充道。
从Robotics X来到AI Lab,张正友花了一段时间来适应新的身份,在一次有姚星参与的内部小范围谈话中,甚至口误说出过"你们Lab"的言论,在内部还引起过一些不满。
然而,姚星对张正友仍然相当支持,甚至为此提醒过脾气耿直的刘威,要和张正友把关系处好。
2019年,张潼离职后,姚星便牵头,将过去的Slogan修正成了:"工业有产出,学术有影响"。只是简单地把两句话的顺序调换了一下,就能看出当时AI Lab的重心,正在从学术探索,开始向工程落地转型。
早先,Lab的编制里,就有工程人员的位置,除了AI平台部更多支持的NLP中心之外,语音和视觉中心也吸纳了不少工程人员,工程团队的总负责人双线向语音和视觉两个中心负责人汇报。
实际上,在AI Lab成立刚不久的时候,顺应着公司MIG(移动互联网事业群)推出"翻译君"、微信快速发展语音识别技术的风潮,TEG的AI平台部也和Lab的语音中心一起合作,研究AI同声传译的能力,并且进展飞速。
这之后,在这种相互赶超的积极氛围下,极少与其他事业群合作的微信,也让自家的产品"微信智聆"和翻译君一起联合推出了"腾讯同传",服务博鳌亚洲论坛。小马哥甚至专门发布了一条朋友圈,称这是一次"新尝试",请大家反馈效果,多多包涵。
然而早期,在学术团队话语权更重的Lab,工程团队的工作常常是给学术团队打助攻,帮忙发论文——这也与姚星设置工程团队的理念相去甚远。
张正友来到AI Lab,做的一件大事,就是在内部设置了产研中心,用更高的优先级,去攻关AI技术的工业落地。产研中心的人数,一度占到整个Lab的一半之多。
在雷峰网先前的文章《腾讯AI·五问|混元的三年战争》中提到,张潼之后,AI Lab管理科学家的方式产生了不少变化——在张正友时代,姚星给了他更大的管理权限,让他更像一个Lab的"主任",自己相对回撤,把更大的自由给到AI Lab的体系里。
于是,增设产研中心,张正友在内部也并未遇到太大的阻力。
在产研中心,张正友希望的,是把AI技术PaaS化,把比如语音的SR(说话人识别)、TTS(语音合成)等技术模块封装成平台型产品,做标准化服务,让使用者直接调用API,以形成更大的影响力。
彼时在大环境上,AI四小龙正式完成崛起,让资本和市场对于AI的热情高涨;而这段时间,也是腾讯AI Lab技术落地的高峰期:诸如农业AI iGrow系统、虚拟人技术、人脸识别系统、语音前端技术等成果,已经在腾讯多个产品和业务中落地应用。
沿用PaaS的理念,也符合AI Lab作为技术中台的组织设计初衷,但问题却出在了用人的层面上。
新设的产研中心对于AI Lab原有架构的冲击,在雷峰网"腾讯AI·五问"的文章中都有提及——在产研中心,如AI Lab的架构设计一样,下设了NLP、语音等几个组,与Lab的几个中心的研究内容也有所重叠。
而作为亲设的部门,张正友也不吝把资源向产研中心倾斜,这也在实际上让产研中心和Lab另外几个中心的关系有些尴尬。最初的设定,是把新招入的博士给Lab几个学术中心做研究,把研究生放进产研中心负责工程。而慢慢地,产研中心人才密度问题开始显现,博士生也开始流入产研中心,这让产研中心和其他中心的差异变得越来越小。
一位AI Lab的老员工对雷峰网分享,在NLP领域,产研中心拿下了王者荣耀AI解说的工作,NLP中心则转向了对智能写作的攻关,与兄弟部门平行工作;而语音领域的研究门类相对比较集中,不过是SR、TTS、声纹识别等几个方向,产研中心和语音中心两个部门的工作,难免有重合的部分,这就让彼此的工作中多了一些难处。
学术和工程相互掣肘,这显然并不是腾讯乃至姚星调整的本意。然而,姚星本人也在2021年离职创业,乘着元宇宙的大潮创立了"元象科技",今天仍然活跃在AI和3D领域的第一线。张正友则在不久后升上了17级,成为了腾讯职级最高的技术人才。
谈起姚星,不少在AI Lab与他共事过的人,都把他称为Lab一时之间的"灵魂人物"。"他是真正希望能把Lab做好的人,"和姚星在腾讯共事过的毕统说道,"因为Lab是他一手建起来的,跟自己亲孩子一样。"
在姚星离职不久之后,张正友再一次地把AI Lab的Slogan改回了"学术有影响,工业有产出",虽然对内释放出了要把学术研究放在更高优先级的信号,但实际上产研中心仍然占据着更多的资源,AI Lab的动荡也仍在继续,大量人才离职,这也为之后腾讯AI的发展轨迹造成了影响。
在腾讯AI的发展历程上,优图是一个无法被绕过的名字。
作为腾讯的另一个AI研究重镇,优图曾在2016年被SNG总裁汤道生尝试提升为整个集团层的计算机视觉中心,不仅服务SNG事业群的QQ体系,更要赋能万业。
但此举引起了TEG总裁卢山的注意。尤其在AI Lab成立后,其与优图虽然分属TEG和SNG旗下,但二者同为腾讯AI业务的两大支柱部门,相近的研究方向与同样豪华的学者阵容,也让两个团队大有同台竞技之意。
因此当汤道生试图通过优图掌握集团层的AI话语权时,卢山不可能将之拱手相让,更有了高举高打AI Lab的理由。
不过,无论是卢山、汤道生,还是AI Lab与优图的多位领导人,都曾在多个场合强调各自的实验室没有营收KPI。比如张潼,在谈到AI Lab的考核指标时就坦言:"其实还是相对比较宽松,主要会关注paper的发表和产品的应用。"
相比营收KPI,论文KPI无疑更容易量化、也更容易建立学术影响力。
论文KPI,也成为这一时期AI Lab与优图的主要考核指标,以及共同的发力方向。
2017年,AI Lab率先亮剑,在ACL、ICML、NIPS等多个国际平台上取得出色表现。刘威带领下的计算机视觉团队,更是在CVPR(IEEE国际计算机视觉与模式识别会议)上入选6篇论文,备受行业认可。
只是这份喜悦很快就被冲淡。在随后举行的ICCV(国际计算机视觉大会,与CVPR、ECCV并称计算机视觉领域三大顶级会议)上,贾佳亚带领下的优图成绩更加亮眼:入选论文12篇,位居行业前列。
转折出现在2018年。
据内部人士透露,刘威对论文数量的更多关注,影响并拉动了整个团队的论文产出——在CVPR 2018上,AI Lab入选21篇论文,是上一年的3.5倍。
但这还远未结束。除了在ACL、Interspeech、AAAI、EMNLP等国际平台上捷报频传,AI Lab这一年在ECCV(欧洲计算机视觉大会)上风头之盛,甚至盖过优图:入选论文19篇,比优图足足多出8篇。
AI Lab是不是已经走在了优图前面?彼时外界议论纷纷。
2019年,优图用行动给出答案。
没有想象中的自乱阵脚。在两年一届的ICCV上,优图入选论文13篇——较前次稳中有进。在CVPR 2019上,优图的论文入选数也再创佳绩,达到25篇。虽然逊色于AI Lab的33篇,但差距已经明显得到控制。
如果聚焦医学影像分析领域,在这一年的MICCAI(国际医学图像计算和计算机辅助干预会议)上,优图则与AI Lab旗鼓相当,各自入选了4篇论文。
不过,就在AI Lab与优图围绕论文产出在国际舞台上大放异彩的当口,贾佳亚的离职,打了所有人一个措手不及。
据内部人士猜测,导火索或许是"930变革"后,集团引入优图的新考核指标。
简单来说,随着"930变革"的开启,优图随汤道生一起划入CSIG(云与智慧产业事业群),并开始承担CSIG的一部分营收KPI。
但优图内部长期实行以贾佳亚和吴运声为核心的双领导制,让现实情况更加复杂:贾佳亚主外,聚焦学术影响力和科研成果,不承担直接的营收KPI考核,向CSIG负责人汤道生汇报;吴运声主内,聚焦产品化赋能,承担优图视觉技术和云底层融合的相关工作,向腾讯云CTO王慧星汇报。
同属一个部门,但有两位领导,两种汇报体系,两个发展目标。这种兼顾学术影响力与技术落地的发展愿景,显然存在不小的实现难度。加之坊间曾传闻,优图在论文产出上略逊于AI Lab的事实,让贾佳亚在集团内部的地位一度受到质疑。
凡此种种,或许都促成了贾佳亚最后的离开。
至于隔壁的刘威,虽然带领团队在论文产出上屡创佳绩,但此后也离开AI Lab,转入由腾讯副总裁蒋杰率领的数据平台部,担任广告多媒体AI中心主任,也在后续混元的开发中起到了不可忽视的作用。
不过,就在AI Lab与优图双双进入人事变动期的彼时,国内AI行业也逐渐进入沉寂期,深度学习和AI商业化双双遇到瓶颈。而身处这场行业变迁的AI Lab也受到波及,加之人才的大量出走,都让AI Lab此后数年的发展脚步愈发谨慎。
2022年11月底,GPT-3.5发布,引爆了全球大模型热潮。但布局AI多年的腾讯,却把混元大模型的发布时间推迟到次年9月,比百度、阿里都晚。
腾讯自然有不急于下场的理由:直到今天,微信作为入口的优势仍然难以撼动。
看起来,腾讯似乎是最能吃到模型红利的公司。
但另一个不能忽视的事实是,字节在2025年完成了Seed团队对AI Lab等研究部门的整合,阿里通义体系也在这一年结束了对达摩院、AI Labs等基础研究力量的收编。和这两者对比,腾讯混元团队在整合深度上显然没有完全承担起集团级AI研究中枢的角色。
是战略使然?还是一步慢,步步慢?
而这,就是另一个故事了。