标签

AI征服围棋却败给麻将:信息差异揭示智能边界

发布时间:2026-06-01 13:12来源:微信阅读:13

AI能打败围棋世界冠军,却在麻将桌上输给普通人

AlphaGo赢了柯洁之后,很多人以为AI已经无所不能。但有一件事很少被提起:同样的技术路线,放到麻将桌上,表现平平。这不是算力不够,而是两个游戏在本质上是两种完全不同的问题。搞清楚这个区别,你会对AI的能力边界有全新的理解。

2017年,AlphaGo以3:0横扫柯洁。赛后柯洁哭了,说感觉自己面对的不是人类。围棋界普遍认为,这项延续两千五百年的游戏,人类时代就此终结。

同年,有研究团队开始尝试用类似方法训练麻将AI。结果让人意外——在标准四人日麻规则下,AI的胜率长期徘徊在接近随机水平,远不如围棋那样碾压人类。这不是偶然,背后有一个非常清晰的逻辑。

围棋是一个「上帝视角」游戏

围棋的关键特征是:完全信息。棋盘上的每一颗棋子,双方都看得一清二楚。没有隐藏,没有遮挡,没有任何需要猜测的地方。你当前看到的,就是游戏的全部状态。

这对AI来说是天赐良机。AI最擅长的事情,就是在一个定义清晰的空间里穷举可能性,然后找出最优解。围棋的棋盘是19×19,理论上的局面数超过宇宙中原子的总数,但这不是问题——AI不需要穷举所有局面,只需要找到一个足够好的评估函数,再配合蒙特卡洛树搜索,就能在这个「上帝视角」下做出比人类更准确的判断。

●围棋的核心挑战是「搜索空间太大」,但信息是完整的。AI解决的,恰好是搜索空间问题。

麻将是一个「雾中作战」游戏

麻将的结构完全不同。你手里的牌只有你自己知道,其他三家的手牌对你是隐藏的。你能观察到的只有:牌墙剩余数量、已经打出去的牌、以及别人的摸牌行为。这在博弈论里有个专门术语——不完全信息博弈。

不完全信息不只是「信息少一点」,它从根本上改变了问题的性质。在围棋里,最优策略是存在的——理论上有一个「完美下法」,AI在逼近它。但在麻将里,因为你永远不知道别人手里有什么,所谓「最优策略」本身就是一个概率分布,而不是一个确定答案。

136

标准麻将的总牌数,你只能看到自己的13张,其余对你来说是黑箱

更复杂的是,麻将是四人博弈,不是两人对抗。围棋的对手只有一个,你优化的目标很明确:让自己赢,让对手输。麻将桌上,你可能需要故意放炮给某个人,阻止另一个人赢——这涉及到多方利益的动态平衡,策略空间的复杂度呈指数级上升。

不是算力的问题,是问题类型不同

AI在围棋上的成功,掩盖了一个事实:它解决的是一类特定问题,而不是所有问题。

很多人的直觉是:AI在麻将上表现差,是因为算力还不够,等算力上来了就能解决。这个判断大概率是错的。围棋和麻将的差距,不是量的差距,而是质的差距。

打个比方:你给一个人一张完整的地图,让他找从A到B的最短路径——这是围棋式的问题。你给另一个人一张有大片空白区域的地图,让他在不知道地形的情况下做决策——这是麻将式的问题。再强的计算能力,也无法凭空生成你没有的信息。

目前AI在麻将上取得的最好成绩,来自日本团队开发的「Suphx」。微软研究院2019年发布的这个系统,在天凤平台(顶级日麻对战平台)上达到了十段,超过了99.99%的人类玩家。听起来很厉害,但注意:这是在日麻规则下,通过大量对局数据学习人类的风格模仿,而不是像AlphaGo那样推导出「最优解」。本质上,它学会的是「像高手一样打牌」,而不是「找到最优打法」。这是两件完全不同的事。

这个区别,比你想象的更重要

理解「完全信息」和「不完全信息」的边界,其实是理解AI能力边界的钥匙。

1完全信息场景:围棋、象棋、扫雷(已知地图)——AI可以逼近甚至超越理论最优

2不完全信息场景:麻将、德州扑克、商业竞争——AI只能学习策略分布,无法找到唯一最优解

3现实世界几乎全是不完全信息场景

德州扑克是另一个典型案例。2017年,卡内基梅隆大学的Libratus击败了顶级扑克职业选手。但Libratus的方法论和AlphaGo完全不同——它用的是「纳什均衡」逼近,本质上是找到一个「对手无论怎么打,我都不会太亏」的策略,而不是「找到赢对手的最优解」。这是博弈论里的防御性思维,不是围棋式的进攻性最优。

回到麻将。麻将之所以经久不衰,恰恰是因为它保留了人类才能充分利用的那些能力:读人、欺骗、心理博弈、对局势的直觉判断。这些东西目前没有办法被形式化成一个清晰的优化目标,所以AI在这里只能跟着学,不能领着走。

✦ 小结

AI在围棋上的神级表现,是因为围棋是完全信息博弈,AI最擅长在信息完整的空间里做精确计算。麻将是不完全信息的四人博弈,最优策略本身不存在唯一解,AI只能学习风格,无法推导最优。这个区别告诉我们:AI的能力边界,不在于算力大小,而在于问题的信息结构。现实世界绝大多数重要问题,都更像麻将,而不像围棋。