标签

NUS毕业生访谈:当AI走进游戏世界

发布时间:2026-05-11 14:04来源:微信阅读:5

关注「NUS叙」,故事很长,我们慢慢讲。

Qingmu

NUS 2024届毕业生

数据科学与机器学习

MSc in Data Science and Machine Learning

AI算法工程师 | 游戏行业 | 技术思考者

她曾在新加坡科研机构A*STAR参与科研工作,主要从事计算机视觉方向的研究。毕业后,她进入互联网游戏行业,成为一名专注于大语言模型应用的算法工程师。

目前,她主要探索AI在游戏场景中的落地应用,例如玩家交互理解、智能陪玩与游戏Agent等方向。

她也持续关注人工智能在实际产业中的发展趋势,不断思考技术、行业与个人成长之间的关系。

Q1:在NUS就读期间,您去到了新加坡科技研究局A*STAR实习,这段经历对您而言最大的影响是什么?您从中学到了什么?

去A*STAR之前,我其实带着一个没有想清楚的问题:我到底适不适合做科研?

本科期间跟着导师做过一些研究项目,他一直鼓励我读博。在那种氛围下,"继续做科研"似乎是一条自然而然的路。但说实话,我并不确定自己是真的热爱研究,还是只是习惯了被推着往前走。NUS的项目提供了去A*STAR实习的机会,我当时的想法很明确——给自己一次认真的验证:在一个足够自由的环境里,没有人要求我必须做什么的时候,我还会不会主动选择科研。

当时我的研究方向是计算机视觉,主要做的是图像分类相关的工作,但面对的是一些样本量比较少、比较稀有的图像数据,希望通过模型让AI也能准确识别这些罕见类别。那段时间里,我学到了很多基础但重要的科研能力,比如如何设计实验、如何分析结果等等,也掌握了很多新的技术,但对我来说,那段经历带给我的思考空间更为珍贵。

如果对比一些在国内读研的同学,他们更多时候是由导师安排具体任务,比如参与并承担课题中的一部分工作,需要你按照既定目标推进项目进度。很多事情并不是从“我想研究什么问题”出发,而是基于“这个课题现在需要什么工作”,久而久之,人就会逐渐习惯在这样的结构里行动。

NUS毕业照

本科阶段我也有类似的感受,整个培养体系往往是围绕绩点、排名或者保研标准展开的,使得很多事情都有一套比较明确的标准路径。当你身处这样的环境中,你会发现身边的人几乎都在沿着同样的轨道往前狂奔。在这种节奏的推动下,你很难允许自己停下来思考太久,好像一旦停下来,就会被这个系统甩在后面,所以很多人其实并不知道——我到底想做什么?

相比之下,A*STAR的环境相对自由,没有严格的KPI,也没有人每天去追问你具体在做什么。更多时候,你是被允许按照自己的节奏去探索问题并一步步推进研究的。

但也正是这种自由,当我真的在做我以为自己感兴趣的研究时,我反而开始问自己——我真的愿意以后的每一天都这样生活吗?我是不是真的喜欢做研究?如果没有人要求我必须做这件事,我还会不会继续做下去?

于是我又开始了漫长又无边的思考,而后我最终意识到:我可以做好科研,但这不是我想投入一生的事情。这个认知直接影响了我后来的选择,决定去业界内多走一走看一看,现在我在国内一家互联网公司做算法工程师。

不断反问自己,不断向内探索

Q2:从NUS毕业后您没有继续走科研这条道路,而是进入了游戏行业大语言模型方面的算法工程师,这个转变顺利吗?学术研究和真实商业中的工作有什么让您印象深刻的不同?

我在NUS期间主要做的是计算机视觉方向的研究,现在我的工作转向了大语言模型。表面上看,这两个方向都属于人工智能领域,底层的一些方法是共通的,但如果往具体业务应用和数据层面去看,差别还是很大的。硕士阶段的学习并没有直接教会我现在工作的具体内容,但它给了我一个比较扎实的基础,让我能够跨过行业的门槛。

我现在的岗位是算法工程师,在这个过程中,我们要不断思考如何把AI真正落地到具体的产品场景里,让它在业务中产生价值。例如在游戏里,玩家说一句话,AI需要理解玩家的表达意图,给出一个合适的回应;让AI的回复更自然、更有趣,从而提升玩家的整体游戏体验。很多时候我们做的事情,其实就是围绕这些具体场景去设计模型和系统。

进入公司之后,让我最冲击、也最印象深刻的一点,是学术研究和真实应用中的差别。不是技术栈的变化,而是"什么才是问题"这件事本身变了。在学术研究中,问题是被精心定义好的:数据集是公开的、评测指标是确定的,研究的核心是在这些固定条件下把模型做得更好。但在真实业务中,要面对的是数据噪声和模糊的问题。

在企业真实的应用中,你首先面对的是一大堆“很脏的数据”。拿我现在做的文本相关任务来说,每一天都会出现新的网络梗、新的表达方式、各种不同语气和语境的语言。数据是不断变化的,而且充满了噪声,如果这些数据本身没有被很好地整理和定义,模型往往是学不好的。

还有一个很有意思的地方是,人类在理解语言时其实是非常依赖语境和情绪的,比如同一句话,在不同时间、不同场景下,人对它是否“冒犯”或者是否“合适”的判断可能完全不一样。但训练模型时,机器没有这种感觉。所以我需要做的,是去定义一个精确的标准,做好把关的工作:这句话到底算不算冒犯?这个表达该怎么界定?

学术训练是如何把一个问题做深,而工业实践是如何在复杂、模糊、不断变化的条件下,找到一个能持续产生价值的方案。但也正是这种复杂性,才真正推动一个人去成长。

尽早进入真实的应用场景

Q3:您目前在游戏行业从事AI算法相关工作。在您看来,这个领域目前最具有突破性的技术趋势是什么?未来的终极形态可能会是什么样?

如果从最近一两年的发展来看,我觉得游戏行业里一个非常明显的趋势是AI Agent的出现。

今年这类应用特别多,很多游戏中已经有专门针对玩家设计的陪玩AI。这样的AI不只是简单的NPC,它需要具备多种能力:首先,它要能够理解玩家说的话,并进行自然的交流;其次,它要能够参与游戏本身,比如判断战局、执行操作、与玩家协同作战。例如玩家可能会指挥它去某个位置、执行某个策略,AI既可以选择配合,也可能根据自己对局势的理解做出不同的判断。这种互动方式其实已经很接近人与人之间的合作关系。

在技术上,目前最核心的范式是"LLM as Brain",本质上是把游戏里的很多信息——比如玩家的语言、游戏局势、任务目标——都转化为一种可以被模型理解的描述,送入大语言模型进行推理和决策,再将输出解析为游戏可执行的动作。模型面对的是一个 开放的工具/动作空间,需要判断"此刻该调用哪个能力、传入什么参数"。从这个角度来看,现在的AI Agent其实已经在向一种“更完整的数字角色”靠近。

不断思考技术、行业与个人成长之间的关系

当然,目前的AI Agent还远远没有达到最终形态,它在表现和性能上还能做得更好。遇到训练分布外的罕见局面,决策质量会显著下降。但如果未来模型能力进一步提升、算力也足够充足,那么AI可能可以通过推理能力,在从未见过的场景中做出合理决策,甚至在一些关键策略判断上超过人类玩家。

不过从实际工程角度来看,目前最大的瓶颈往往不是算法本身,而是算力和成本。游戏通常面对的是海量玩家,如果每个玩家都需要一个非常复杂、非常聪明的AI去实时计算和响应,那对计算资源的需求是非常巨大的。当下的阶段,很多技术其实已经可以达到很高的层次,但是否能够大规模部署,还会受到性能和成本的限制。配合模型蒸馏、量化、推理优化等工程手段,可以在效果和成本之间找到平衡点。随着芯片算力的持续提升和推理框架的优化,这个平衡点会不断向"更智能"的方向移动。

至于终极形态,AI在游戏里就不仅仅是做一个陪玩了,而是游戏世界中真正的自主角色。它有自己的目标、记忆和个性,能够和玩家建立跨局、跨场景的长期关系。

在技术世界里做人生选择

Q4:很多人认为,AI的发展不仅仅是一场技术革命,也可能带来哲学和伦理层面的挑战。作为行业从业者,您是怎么看待例如“AI生命”“AI权利”这样的讨论?

我对这个问题的看法可能和纯粹从用户视角出发的人有些不同。

现在的大语言模型确实已经非常强大。无论是GPT、Claude还是Gemini,它们拥有远超任何个人的知识储备,它们在很多任务上的表现已经远远超过普通人,一个人穷尽一生也不可能读完它们预训练阶段接触到的那些东西。他们可以进行流畅的对话、复杂的推理,甚至表现出某种"个性"。站在用户的角度,很容易产生一种感觉:它已经很像一个真实的个体了。

无论现在的大语言模型多么复杂,它的核心仍然是基于大量数据训练出来的概率模型,本质上是在根据已有信息去预测下一个最合理的输出。它的每一个"聪明"的表现,都可以追溯到具体的技术原因:预训练数据的覆盖范围,对齐训练,解码策略等等。它非常强大,也可以在很多任务上超过人类,但这并不意味着它具备真正的意识、情感或者主体性。它可以模拟关心、模拟愤怒、模拟犹豫,但这些都是学习到的模式,而非内在体验。

当然,从哲学和伦理的角度来看,这些问题仍然值得讨论。我们刚才讨论的那种未来游戏AI的形态——当这样一个AI和你交互了上百局,记得你的风格偏好,会在关键时刻给出战术建议的时候,玩家在心理上很难不对它产生某种情感投射。这里的伦理挑战在于人类会不会把它当作生命。

如果从技术现实的角度来说,我觉得我们现在距离真正需要讨论“AI生命权利”的阶段,其实还有非常长的一段路。

探索复杂世界的答案

Q5:您提到在现在的工作中有时会感受到一种“消耗感”。这种消耗具体来自哪里?它和学生时代那种需要“坚持”的状态有什么不同?

我觉得需要先区分一下“消耗”和“辛苦”。有些人可能每天工作很多小时,但如果他们很清楚自己在做什么、目标在哪里,同时也对这件事情本身有热情,那么这种投入其实更像是一种自愿的努力,而不是消耗。因为你知道自己为什么要做,也能看到方向和意义。

但我现在感受到的消耗,更多来自于一种长期处在不确定中的状态,而这并不一定和工作时间长短有关。比如在工作中,我经常会遇到很多很难判断的问题:这个情况到底应不应该用模型去解决?我对模型做的这一次调整,会不会真的带来效果?现在的数据是否足够支持结论?在性能、成本和效果之间,我应该如何取舍?

尤其是像算法和模型相关的工作,很多时候大家会开玩笑说自己是“炼丹师”。因为模型本身其实是一个非常复杂的系统,有一定的黑盒性质。你可能做了很多尝试、做了很多改动,但最后的结果却未必有明显变化。

真正的稳定来自于自己创造价值的能力

在大厂还有一个很现实的问题,公司规模很大、分工非常细,每个人往往只负责一个很小的部分。很多时候你其实是在做一颗“螺丝钉”,长期专注在一个非常细小的环节上。当你反复做一件非常细碎的事情时,有时候会很难获得那种完整的成就感。你可能投入了很多精力,但很难清楚地看到自己的工作在整个系统中到底产生了多大的影响。

这和我在学校里的那种“坚持”很不一样。学生时代,我做那个从零开始的项目,虽然也漫长、也磨人,但我知道方向在哪里,知道坚持下去是有明确目标的。而工作中的这种消耗,是在迷雾中摸索,不知道自己在做的到底对不对。很多时候我可能还是在用以前学生的思维方式去看待工作。比如会很在意别人对我的评价,或者会把“是否被认可”“是否被选择”看得比较重要。

但我现在也在慢慢意识到,真正稳定的职业状态,可能更多来自于自己创造价值的能力,而不是完全依赖外界的评价体系,而这种转变也需要时间慢慢完成。

在不确定的时代寻找确定的自己

Q6:如果展望未来,您希望自己在哪些能力上进一步提升?如果回到学生时代,您会对当时的自己说些什么?

如果从职业发展的角度来说,我希望未来自己能够拥有一种更系统、更高维度的理解能力,也就是系统设计的全局视角。做算法很容易只关注模型本身,但在工业场景中,模型只是系统的一环——上游的数据管道、下游的工程部署、线上的监控迭代,这些环节的质量往往比模型结构的选择更影响最终效果。我希望未来能从"做好一个模型"成长为"设计好一个系统"。

另外一个我希望提升的是从业务问题到数学问题的抽象能力。算法工程师日常很容易陷入具体的指标优化—Recall涨了几个点、延迟降了多少毫秒——但真正决定一个项目上限的,往往是最初的问题建模。我希望自己能更快速、更准确地完成这个从"混乱的业务需求"到"清晰的优化目标"的转化。这个能力更多靠在一个又一个真实项目中积累判断力。

如果有机会回到学生时代,我会对当时的自己说:不要太着急去追求“最好的模型”或者“最强的技术”。学生阶段很容易追逐最新的模型和算法,觉得掌握了最强的工具就等于拥有了最强的能力。但工作之后你会发现,技术选型只是手段,真正稀缺的能力是判断一个问题是否值得被建模、以及用什么粒度去建模。一个定义得好的问题,用简单的方法就能产生很大的价值;一个定义得差的问题,那么即使你在技术上做到了极致,它的意义也可能非常有限。

另外我也会多问问自己的内心:我到底喜不喜欢这个行业?如果你真的喜欢AI行业和游戏行业,并且相信自己可以在里面创造一些技术价值,那么就可以大胆地去尝试。相比之下,去做一些表面上看起来正确、但自己并不真正喜欢的事情,反而会更容易消耗自己。

很多时候我们会觉得时间很紧,必须尽快做出正确选择:选方向、选导师、选行业,每一步都怕走错。但其实换个角度想,每一天都是人生中最年轻的一天。所以与其过度焦虑未来,不如认真去做那些自己真正感兴趣、也愿意长期投入的事情。

- 本 期 话 题 -

你会怎么看待例如“AI生命”“AI权利”这样的讨论?

欢迎评论区留言,和我们交流