AI兴衰解析：探寻技术本质而非成败

发布时间：2026-05-17 16:47阅读：22

近期在多次关于AI企业的讨论中，不可避免地会提到一些已经发生的行业变化，例如xAI的关闭、Anthropic超越OpenAI的业务表现、文心一言起步早但进展慢、腾讯AI未达预期等。当然，也有不少表现出色的企业，如豆包、通义千问在国内处于领先地位，Gemini也后来居上，展现出强劲势头。以下是我对这些现象的一些思考。

在探讨这一话题时，我并不想以简单的“成王败寇”视角来看待AI创新。我认为，AI创新本质上是一项技术工作，它有其内在规律，通过总结经验可以提升整个行业的效率。

我将AI企业失败的原因归纳为三点：

1、企业领导者对AI领域缺乏深入了解，却过度干预研发和运营决策，这类AI企业最终难逃失败命运。

xAI就是最典型的例子。马斯克个性强势，但他并非AI领域的专家，却强行主导发展方向，导致团队11位创始人全部离开，公司人心涣散，最终部分业务关闭。OpenAI也面临类似问题，早期由技术专家Ilya领导时发展稳健；而Sam Altman接管后，公司过度商业化，逐渐偏离核心，发展势头持续走弱，最终被Anthropic在商业上赶超。

2、企业主营业务成熟且盈利稳定，员工安于现状，不愿投身艰苦的底层技术研发，这类企业在AI领域失败的可能性极大。

AI研发流程复杂、任务繁重，需要长期专注基础性工作。如果企业原有业务轻松盈利，内部员工很难再有攻坚克难的动力，难以组建真正能沉下心的AI团队。腾讯就是典型代表，游戏和社交业务现金流充裕，内部氛围相对安逸，难以推动团队全力投入AI研发。而阿里则相反，即使在技术发展较好的时期也没有轻松躺赢的业务，全员长期保持奋斗精神，正是这种韧劲支撑了阿里云和通义千问的成功。

3、企业文化松散，无法凝聚全公司力量应对重大创新挑战，这类企业同样难以在AI领域取得成功。

百度是典型例子。其内部文化较为松散，早期凭借搜索业务站稳脚跟后，长期缺乏颠覆性创新。虽然百度技术底蕴深厚，战略眼光也不差，但无论是O2O还是自动驾驶领域，最终成果都未能领先。文心一言也未能获得市场认可。究其根本，百度内部管理松散、执行力不足，无法整合全公司资源打造出具有统治力的产品。正如《人类简史》中提到的，企业的成功不仅依赖资金、技术与风口，更需要统一的信念、严谨的作风和强大的组织凝聚力。

总结失败经验虽然困难，也容易引起反感，但这些教训往往更具价值，能够警醒团队，为更大的成功奠定基础，同时提升社会资源的创新效率。

相比之下，成功经验的总结就容易得多。以下是我总结的几点成功要素，它们往往是对失败经验的反向验证：

1、AI团队的领导者必须真正懂AI。

谷歌Gemini的成功离不开DeepMind负责人哈萨比斯，OpenAI的成功与Ilya密不可分，Anthropic的成功也离不开CEO达里奥。小米MIMO的崛起也有罗福莉的贡献。这些成功案例的共同点是，AI团队的领导者对AI技术有深刻理解。

2、AI早期成功的关键在于专注。

Anthropic专注于代码生成和安全，因此成功超越OpenAI。OpenAI早期专注于大语言模型，心无旁骛地推进大参数规模，也取得了成功。但自从Sam Altman掌权后，OpenAI开始多元化发展，Sora、DALL.E等业务分散了核心资源，反而在核心赛道上被Anthropic反超。智谱在GLM方面异军突起，也是因为聚焦。

我支持商业化，但反对过度商业化。Anthropic在聚焦的同时也注重商业化，这正是其成功的关键。

3、在应用场景选择上，需要明确的反馈机制。

大模型训练需要真知识（Ground Truth）和底层约束（Ground Constraint）。代码场景完全符合这两个条件，大量可运行的工程代码就是真知识，代码语法和编程规则就是真约束。在安全领域，法院判决、黑客攻击等案例是真知识，法律条文、安全规范等是底层约束。Anthropic正是瞄准了这些具备明确反馈的场景，Claude模型才得以成功并超越OpenAI。

4、AI团队必须高度重视基础设施建设。

强大的基础设施团队是AI训练成功的基础。基础设施决定了训练效率、硬件利用率和最终效果。

有业内人士分享，在硅谷与不同AI团队交流后了解到，前四大基础设施排名分别是谷歌、OpenAI、英伟达、xAI。虽然这个排名未必完全客观，但没有好的基础设施确实难以训练出优秀的AI模型。

5、数据质量对模型质量起决定性作用。

业内有观点认为，Meta长期尝试训练MoE架构模型却难以收敛，直到Llama 3都不得不放弃稀疏模型路线。而法国AI企业Mistral已成功训练出8专家MoE模型，说明当时业界已掌握多专家模型训练技术。Meta未能攻克MoE训练难题，核心原因在于其研发理念偏重数据规模而非数据质量，导致训练数据中冗余噪声过多，影响模型收敛。而国内DeepSeek-V3的问世，其MoE架构单层级专家数量高达256个，实现了稀疏模型规模的突破。数据质量对SFT、RFT微调训练尤为关键，DeepSeek-V3-R1通过大规模后训练策略强化了模型推理能力，成就了中国AI的高光时刻。

创新本就充满挑战，AI创新更是任重道远。在其中，人的作用至关重要，专业素养、管理格局、创新思维缺一不可。LLM格局已定，具身智能浪潮已至，行业仍需持续创新，不断前行！

← 上一篇：AI助力智慧课堂建设，信息学院工作坊圆满落幕下一篇：AI群像大观 →