标签

豪掷千亿!米哈游全面押注AI新纪元

发布时间:2026-05-16 17:27来源:微信阅读:13

致力成为游戏领域最具价值的全球连接枢纽

5月15日,米哈游在北京召开了AI大模型技术交流会及高端校园招聘宣讲。活动采取非公开形式,仅邀请高校顶尖学子与技术界核心人士参加。会上正式宣布将投入千亿资金并坚持全栈自研路线,这标志着米哈游的战略重心将向AI驱动的科技型企业深度倾斜。

在此次分享会上,米哈游联合创始人刘伟(大伟哥)亲自登台,阐述了对AI业务的宏伟愿景,并公布了一个令人震惊的数据:未来三年内,计划最高投入1000亿元深耕AI领域。他坦言:“即便最终未能成功,也没关系,就当是放了一场盛大的烟花。”这种破釜沉舟的态度,充分彰显了米哈游在AI领域深耕的坚定意志。

战略层面坚决摒弃“大企业病”

在分享会中,大伟哥首先强调:“公司创始人必须同时担任技术负责人,必须亲自在一线处理所有事务,唯有如此才能将大模型做成。”

在当前时代,AI大模型的迭代速度极快,若决策层脱离技术一线,仅凭汇报做决策,高昂的管理成本不仅会拖垮团队,更会导致企业被时代淘汰。因此,最高决策者必须扎根于代码与训练曲线的前沿,唯有这样才能保持极致的技术敏锐度。

事实上,米哈游早已践行这一理念。在游戏日报此前关于刘伟在上海交通大学演讲的报道中曾提及,联合创始人蔡浩宇无论公司规模如何扩张,始终坚守技术一线;在AI大模型时代到来后,他毅然放下米哈游的所有事务,从零开始学习钻研。近期Agent技术备受瞩目,蔡浩宇也会亲手搭建Agent,即便每日睡眠不足五六小时,仍保持着极高的研发热情。

此外,组建AI团队需警惕“大牛陷阱”,坚持优先扁平化。大伟哥表示:“我们不希望只招聘一个大牛。大牛往往有极强的自我意识(ego)和固定的负责范围(scope)……但只有一个年轻且志同道合的团队,才有可能真正实现弯道超车。”

这其实指出,在LLM时代,传统的AI经验反而可能成为“负资产”,阻碍项目推进。一些固守局部优化、执着于“划地盘”的资深管理者,往往自我意识过强,这会扼杀全局视角的创新。在当下,从数据、模型到基础设施,真正能实现突破的,是志同道合、扁平化的年轻团队,而非沉迷于个人职责范围的“大牛”。

另外,在研发效率层面,大伟哥还提出了“AI for AI,Model with Model”的核心逻辑,让AI进入自主研发循环。真正的效率提升并非盲目扩招,而是让大模型自主分析训练瓶颈、编写复杂的GPU内核代码、定位程序漏洞。谁能率先搭建“自动调优沙盒”,谁就能在迭代速度上实现降维打击。

技术层面的“薪火相传”

除了公司战略层面,游戏日报也整理了大伟哥在前沿技术层面的一些深刻见解。

在基建层面,米哈游重新定义了AI基础设施的价值边界。大伟哥指出,模型能力的上限正由基础设施重新界定。在万卡规模下,通信、计算、数据的协同设计早已不是简单的“底层修管道”,而是直接决定算法模型能跑多大参数、支撑多长的上下文。系统工程的核心,就是在正确性与极致性能之间找到最优解。

而在AI预训练环节,米哈游强调数据与工程之间的博弈关系。大伟哥认为,数据决定了0~90分的量级,模型则是完成90~95分的突破。在此前提下,数据清洗、去重与配比决定了模型的基础,小规模训练下看似有效的模型技巧,在极限规模下往往会失效,唯有优质的数据分布才能带来稳定收益。

同时,大规模训练的本质是消灭“小概率事件”,要将小概率事件转化为确定性的工程,否则,“一个简单的损失值异常飙升(Loss Spike)会导致整个模型崩溃。”

即便是在单卡上微不足道的Token异常、算子Bug,看似毫无波澜,但在万卡集群中则会被无限放大,直接导致模型的灾难性崩溃。因此,拥有从梯度到底层算子的全链路可观测能力,是预训练保持稳定、不被“炸毁”的唯一保障。

在后训练与多模态领域,米哈游提出了通往AGI的真实路径,提出智能的终极公式是“Context × Permission”,单纯喂长文本,或给一个没有环境的函数调用都毫无意义,真正的智能体需要让模型读取真实世界的上下文(如代码库、聊天记录),并拥有执行修改的权限,二者相乘才是智能的上限。

而在强化学习方面,米哈游认为简单采用人类反馈强化学习(RLHF)已不是未来方向,下一代强化学习需要让模型在真实交互环境中试错,以“修改代码导致流水线崩溃”这类真实代价作为奖励信号,解决长周期任务的学分分配问题。

未来的多模态也要摒弃简单的“语音转文字+文字转语音”的外挂式流水线,而是在预训练早期就将音频等模态特征融入基座,让模型拥有原生物理感知能力的同时,保留其强大的逻辑推理内核。

米哈游的宏伟蓝图

综合游戏日报之前的报道,不难发现米哈游近日在AI领域动作频频。

米哈游创始人蔡浩宇在硅谷的AI创业公司Anuttacon刚经历了一次重大的战略转向。公司最初的目标是利用AI技术(包括大语言模型、语音、视频)打造“像人”的互动系统,并发布了一款实验性AI对话游戏《Whispers from the Star》进行验证。

如今,这款游戏在Steam平台的评分定位在特别好评(82%好评率),即便整体上得到认可,同时也有不少玩家反馈AI模型还不够智能,未能完全实现玩法概念目标。

而最近,公司停止了多模态表演模型等原有方向的研发,将几乎全部算力和核心团队都集中投入到通用大语言模型(LLM)和智能体Agent的构建上,LLM相关团队整体回流国内,进入集中作战状态,蔡浩宇也将研发重心从美国转移回了中国。

在前不久的大伟哥交大演讲中,AI也是高频出现的词汇。大伟哥指出,人工智能的应用与影响已实现阶段性跃迁,其范围远超早期的聊天对话(Chatbot)功能,如今已进入能够自主规划、使用工具并执行复杂任务的“智能体”(Agent)阶段。当前,智能体已能深度参与大部分非图形界面的软件工程,成为开发者的强大协作者。

在游戏产业,这种变革尤为显著,其影响是双重的。一方面,在游戏制作端,AI正作为“超级辅助”渗透到美术、叙事、设计、编程等全流程,极大地提升效率并降低创作门槛。另一方面,在游戏体验端,更具颠覆性的未来正在临近:预计未来两三年内,AI将实现“千人千面”的个性化游戏体验,能够为每位玩家实时生成独一无二的剧情、任务和玩法,使游戏从固定剧本进化为动态世界。

在这种技术背景下,人类与AI的协作关系正在被重新定义。在当前阶段,AI的核心角色是高效的“解题者”,擅长在人类设定的框架内执行任务、生成内容。而人类不可替代的独特优势,则在于成为“出题者”——即拥有定义问题、设定愿景和探索未知的能力。

而最近,米哈游AI技术已实现部分落地——《崩坏:星穹铁道》中的“帕姆帮帮”(测试版)AI助手就是一个具体运用的例子。通过自然语言交互,帕姆AI能够主动理解并满足玩家需求,不仅可以用它查询攻略(如角色养成、配队建议),还可以与扮演列车长帕姆的AI进行趣味互动,其回复符合角色设定,体验自然。

在技术层面,为应对千万级玩家的高并发挑战,米哈游采用了多模块协同系统、将逻辑推理嵌入模型权重以提升响应速度、应用FP8混合精度训练以降低成本。同时,通过深度定制化训练将游戏世界观“刻入”模型基因,并采用知识库与模型能力层分离的架构,使两者能独立优化,并让模型具备基于反馈的在线强化学习能力,持续进化。

“帕姆帮帮”作为米哈游AI技术进入实际应用阶段的标志,尽管目前作为“测试版”尚有改进空间,但其底层架构具备通用性,可扩展至其他NPC,就在此前,米哈游已构想过如“星穹狼人杀”等AI驱动的新玩法,让AI角色拥有自主行为与策略。这标志着游戏交互方式从传统UI向自然语言的变革,AI正从开发工具转变为游戏体验的核心组成部分,目前也收获了良好的口碑。

同样的,AI NPC系统也在不久前开启二测的《星布谷地》中得到了应用。以咖啡店老板娘“娜洛”为例,其具备长线记忆功能、个性化的情感反应和拟人化的高自由度对话能力,旨在与玩家建立深度的情感连接,从而构成游戏的核心差异化竞争力。即便有时回应略显刻板,但也仍展现出了一定的逻辑反应潜力。

从战略启航到阶段成果落地,米哈游AI事业的版图已然越来越清晰。从短期看,AI是革新游戏生产方式、重构玩家交互体验的核心工具;从长期看,集中攻坚通用AI与智能体,是米哈游布局下一代数字内容、探索AI原生数字世界的关键一步。随着技术持续迭代与团队整合完成,这场由米哈游主导的游戏AI革命,或将持续释放更大的产业能量。

拓展阅读

看见趋势,读懂行业,立即加入