豪掷千亿！米哈游全面押注AI新纪元

发布时间：2026-05-16 17:27阅读：50

致力成为游戏领域最具价值的全球连接枢纽

5月15日，米哈游在北京召开了AI大模型技术交流会及高端校园招聘宣讲。活动采取非公开形式，仅邀请高校顶尖学子与技术界核心人士参加。会上正式宣布将投入千亿资金并坚持全栈自研路线，这标志着米哈游的战略重心将向AI驱动的科技型企业深度倾斜。

在此次分享会上，米哈游联合创始人刘伟（大伟哥）亲自登台，阐述了对AI业务的宏伟愿景，并公布了一个令人震惊的数据：未来三年内，计划最高投入1000亿元深耕AI领域。他坦言：“即便最终未能成功，也没关系，就当是放了一场盛大的烟花。”这种破釜沉舟的态度，充分彰显了米哈游在AI领域深耕的坚定意志。

战略层面坚决摒弃“大企业病”

在分享会中，大伟哥首先强调：“公司创始人必须同时担任技术负责人，必须亲自在一线处理所有事务，唯有如此才能将大模型做成。”

在当前时代，AI大模型的迭代速度极快，若决策层脱离技术一线，仅凭汇报做决策，高昂的管理成本不仅会拖垮团队，更会导致企业被时代淘汰。因此，最高决策者必须扎根于代码与训练曲线的前沿，唯有这样才能保持极致的技术敏锐度。

事实上，米哈游早已践行这一理念。在游戏日报此前关于刘伟在上海交通大学演讲的报道中曾提及，联合创始人蔡浩宇无论公司规模如何扩张，始终坚守技术一线；在AI大模型时代到来后，他毅然放下米哈游的所有事务，从零开始学习钻研。近期Agent技术备受瞩目，蔡浩宇也会亲手搭建Agent，即便每日睡眠不足五六小时，仍保持着极高的研发热情。

此外，组建AI团队需警惕“大牛陷阱”，坚持优先扁平化。大伟哥表示：“我们不希望只招聘一个大牛。大牛往往有极强的自我意识（ego）和固定的负责范围（scope）……但只有一个年轻且志同道合的团队，才有可能真正实现弯道超车。”

这其实指出，在LLM时代，传统的AI经验反而可能成为“负资产”，阻碍项目推进。一些固守局部优化、执着于“划地盘”的资深管理者，往往自我意识过强，这会扼杀全局视角的创新。在当下，从数据、模型到基础设施，真正能实现突破的，是志同道合、扁平化的年轻团队，而非沉迷于个人职责范围的“大牛”。

另外，在研发效率层面，大伟哥还提出了“AI for AI，Model with Model”的核心逻辑，让AI进入自主研发循环。真正的效率提升并非盲目扩招，而是让大模型自主分析训练瓶颈、编写复杂的GPU内核代码、定位程序漏洞。谁能率先搭建“自动调优沙盒”，谁就能在迭代速度上实现降维打击。

技术层面的“薪火相传”

除了公司战略层面，游戏日报也整理了大伟哥在前沿技术层面的一些深刻见解。

在基建层面，米哈游重新定义了AI基础设施的价值边界。大伟哥指出，模型能力的上限正由基础设施重新界定。在万卡规模下，通信、计算、数据的协同设计早已不是简单的“底层修管道”，而是直接决定算法模型能跑多大参数、支撑多长的上下文。系统工程的核心，就是在正确性与极致性能之间找到最优解。

而在AI预训练环节，米哈游强调数据与工程之间的博弈关系。大伟哥认为，数据决定了0~90分的量级，模型则是完成90~95分的突破。在此前提下，数据清洗、去重与配比决定了模型的基础，小规模训练下看似有效的模型技巧，在极限规模下往往会失效，唯有优质的数据分布才能带来稳定收益。

同时，大规模训练的本质是消灭“小概率事件”，要将小概率事件转化为确定性的工程，否则，“一个简单的损失值异常飙升（Loss Spike）会导致整个模型崩溃。”

即便是在单卡上微不足道的Token异常、算子Bug，看似毫无波澜，但在万卡集群中则会被无限放大，直接导致模型的灾难性崩溃。因此，拥有从梯度到底层算子的全链路可观测能力，是预训练保持稳定、不被“炸毁”的唯一保障。

在后训练与多模态领域，米哈游提出了通往AGI的真实路径，提出智能的终极公式是“Context × Permission”，单纯喂长文本，或给一个没有环境的函数调用都毫无意义，真正的智能体需要让模型读取真实世界的上下文（如代码库、聊天记录），并拥有执行修改的权限，二者相乘才是智能的上限。

而在强化学习方面，米哈游认为简单采用人类反馈强化学习（RLHF）已不是未来方向，下一代强化学习需要让模型在真实交互环境中试错，以“修改代码导致流水线崩溃”这类真实代价作为奖励信号，解决长周期任务的学分分配问题。

未来的多模态也要摒弃简单的“语音转文字+文字转语音”的外挂式流水线，而是在预训练早期就将音频等模态特征融入基座，让模型拥有原生物理感知能力的同时，保留其强大的逻辑推理内核。

米哈游的宏伟蓝图

综合游戏日报之前的报道，不难发现米哈游近日在AI领域动作频频。

米哈游创始人蔡浩宇在硅谷的AI创业公司Anuttacon刚经历了一次重大的战略转向。公司最初的目标是利用AI技术（包括大语言模型、语音、视频）打造“像人”的互动系统，并发布了一款实验性AI对话游戏《Whispers from the Star》进行验证。

如今，这款游戏在Steam平台的评分定位在特别好评（82%好评率），即便整体上得到认可，同时也有不少玩家反馈AI模型还不够智能，未能完全实现玩法概念目标。

而最近，公司停止了多模态表演模型等原有方向的研发，将几乎全部算力和核心团队都集中投入到通用大语言模型（LLM）和智能体Agent的构建上，LLM相关团队整体回流国内，进入集中作战状态，蔡浩宇也将研发重心从美国转移回了中国。

在前不久的大伟哥交大演讲中，AI也是高频出现的词汇。大伟哥指出，人工智能的应用与影响已实现阶段性跃迁，其范围远超早期的聊天对话（Chatbot）功能，如今已进入能够自主规划、使用工具并执行复杂任务的“智能体”（Agent）阶段。当前，智能体已能深度参与大部分非图形界面的软件工程，成为开发者的强大协作者。

在游戏产业，这种变革尤为显著，其影响是双重的。一方面，在游戏制作端，AI正作为“超级辅助”渗透到美术、叙事、设计、编程等全流程，极大地提升效率并降低创作门槛。另一方面，在游戏体验端，更具颠覆性的未来正在临近：预计未来两三年内，AI将实现“千人千面”的个性化游戏体验，能够为每位玩家实时生成独一无二的剧情、任务和玩法，使游戏从固定剧本进化为动态世界。

在这种技术背景下，人类与AI的协作关系正在被重新定义。在当前阶段，AI的核心角色是高效的“解题者”，擅长在人类设定的框架内执行任务、生成内容。而人类不可替代的独特优势，则在于成为“出题者”——即拥有定义问题、设定愿景和探索未知的能力。

而最近，米哈游AI技术已实现部分落地——《崩坏：星穹铁道》中的“帕姆帮帮”（测试版）AI助手就是一个具体运用的例子。通过自然语言交互，帕姆AI能够主动理解并满足玩家需求，不仅可以用它查询攻略（如角色养成、配队建议），还可以与扮演列车长帕姆的AI进行趣味互动，其回复符合角色设定，体验自然。

在技术层面，为应对千万级玩家的高并发挑战，米哈游采用了多模块协同系统、将逻辑推理嵌入模型权重以提升响应速度、应用FP8混合精度训练以降低成本。同时，通过深度定制化训练将游戏世界观“刻入”模型基因，并采用知识库与模型能力层分离的架构，使两者能独立优化，并让模型具备基于反馈的在线强化学习能力，持续进化。

“帕姆帮帮”作为米哈游AI技术进入实际应用阶段的标志，尽管目前作为“测试版”尚有改进空间，但其底层架构具备通用性，可扩展至其他NPC，就在此前，米哈游已构想过如“星穹狼人杀”等AI驱动的新玩法，让AI角色拥有自主行为与策略。这标志着游戏交互方式从传统UI向自然语言的变革，AI正从开发工具转变为游戏体验的核心组成部分，目前也收获了良好的口碑。

同样的，AI NPC系统也在不久前开启二测的《星布谷地》中得到了应用。以咖啡店老板娘“娜洛”为例，其具备长线记忆功能、个性化的情感反应和拟人化的高自由度对话能力，旨在与玩家建立深度的情感连接，从而构成游戏的核心差异化竞争力。即便有时回应略显刻板，但也仍展现出了一定的逻辑反应潜力。

从战略启航到阶段成果落地，米哈游AI事业的版图已然越来越清晰。从短期看，AI是革新游戏生产方式、重构玩家交互体验的核心工具；从长期看，集中攻坚通用AI与智能体，是米哈游布局下一代数字内容、探索AI原生数字世界的关键一步。随着技术持续迭代与团队整合完成，这场由米哈游主导的游戏AI革命，或将持续释放更大的产业能量。

拓展阅读

看见趋势，读懂行业，立即加入

← 上一篇：巴菲特风向转变，大幅增持谷歌押注 AI 下一篇：AI 围标揭秘：技术原理与实战案例，2026 投标合规必读 →