AI兴衰解析:探寻技术本质而非成败
近期在多次关于AI企业的讨论中,不可避免地会提到一些已经发生的行业变化,例如xAI的关闭、Anthropic超越OpenAI的业务表现、文心一言起步早但进展慢、腾讯AI未达预期等。当然,也有不少表现出色的企业,如豆包、通义千问在国内处于领先地位,Gemini也后来居上,展现出强劲势头。以下是我对这些现象的一些思考。
在探讨这一话题时,我并不想以简单的“成王败寇”视角来看待AI创新。我认为,AI创新本质上是一项技术工作,它有其内在规律,通过总结经验可以提升整个行业的效率。
我将AI企业失败的原因归纳为三点:
1、企业领导者对AI领域缺乏深入了解,却过度干预研发和运营决策,这类AI企业最终难逃失败命运。
xAI就是最典型的例子。马斯克个性强势,但他并非AI领域的专家,却强行主导发展方向,导致团队11位创始人全部离开,公司人心涣散,最终部分业务关闭。OpenAI也面临类似问题,早期由技术专家Ilya领导时发展稳健;而Sam Altman接管后,公司过度商业化,逐渐偏离核心,发展势头持续走弱,最终被Anthropic在商业上赶超。
2、企业主营业务成熟且盈利稳定,员工安于现状,不愿投身艰苦的底层技术研发,这类企业在AI领域失败的可能性极大。
AI研发流程复杂、任务繁重,需要长期专注基础性工作。如果企业原有业务轻松盈利,内部员工很难再有攻坚克难的动力,难以组建真正能沉下心的AI团队。腾讯就是典型代表,游戏和社交业务现金流充裕,内部氛围相对安逸,难以推动团队全力投入AI研发。而阿里则相反,即使在技术发展较好的时期也没有轻松躺赢的业务,全员长期保持奋斗精神,正是这种韧劲支撑了阿里云和通义千问的成功。
3、企业文化松散,无法凝聚全公司力量应对重大创新挑战,这类企业同样难以在AI领域取得成功。
百度是典型例子。其内部文化较为松散,早期凭借搜索业务站稳脚跟后,长期缺乏颠覆性创新。虽然百度技术底蕴深厚,战略眼光也不差,但无论是O2O还是自动驾驶领域,最终成果都未能领先。文心一言也未能获得市场认可。究其根本,百度内部管理松散、执行力不足,无法整合全公司资源打造出具有统治力的产品。正如《人类简史》中提到的,企业的成功不仅依赖资金、技术与风口,更需要统一的信念、严谨的作风和强大的组织凝聚力。
总结失败经验虽然困难,也容易引起反感,但这些教训往往更具价值,能够警醒团队,为更大的成功奠定基础,同时提升社会资源的创新效率。
相比之下,成功经验的总结就容易得多。以下是我总结的几点成功要素,它们往往是对失败经验的反向验证:
1、AI团队的领导者必须真正懂AI。
谷歌Gemini的成功离不开DeepMind负责人哈萨比斯,OpenAI的成功与Ilya密不可分,Anthropic的成功也离不开CEO达里奥。小米MIMO的崛起也有罗福莉的贡献。这些成功案例的共同点是,AI团队的领导者对AI技术有深刻理解。
2、AI早期成功的关键在于专注。
Anthropic专注于代码生成和安全,因此成功超越OpenAI。OpenAI早期专注于大语言模型,心无旁骛地推进大参数规模,也取得了成功。但自从Sam Altman掌权后,OpenAI开始多元化发展,Sora、DALL.E等业务分散了核心资源,反而在核心赛道上被Anthropic反超。智谱在GLM方面异军突起,也是因为聚焦。
我支持商业化,但反对过度商业化。Anthropic在聚焦的同时也注重商业化,这正是其成功的关键。
3、在应用场景选择上,需要明确的反馈机制。
大模型训练需要真知识(Ground Truth)和底层约束(Ground Constraint)。代码场景完全符合这两个条件,大量可运行的工程代码就是真知识,代码语法和编程规则就是真约束。在安全领域,法院判决、黑客攻击等案例是真知识,法律条文、安全规范等是底层约束。Anthropic正是瞄准了这些具备明确反馈的场景,Claude模型才得以成功并超越OpenAI。
4、AI团队必须高度重视基础设施建设。
强大的基础设施团队是AI训练成功的基础。基础设施决定了训练效率、硬件利用率和最终效果。
有业内人士分享,在硅谷与不同AI团队交流后了解到,前四大基础设施排名分别是谷歌、OpenAI、英伟达、xAI。虽然这个排名未必完全客观,但没有好的基础设施确实难以训练出优秀的AI模型。
5、数据质量对模型质量起决定性作用。
业内有观点认为,Meta长期尝试训练MoE架构模型却难以收敛,直到Llama 3都不得不放弃稀疏模型路线。而法国AI企业Mistral已成功训练出8专家MoE模型,说明当时业界已掌握多专家模型训练技术。Meta未能攻克MoE训练难题,核心原因在于其研发理念偏重数据规模而非数据质量,导致训练数据中冗余噪声过多,影响模型收敛。而国内DeepSeek-V3的问世,其MoE架构单层级专家数量高达256个,实现了稀疏模型规模的突破。数据质量对SFT、RFT微调训练尤为关键,DeepSeek-V3-R1通过大规模后训练策略强化了模型推理能力,成就了中国AI的高光时刻。
创新本就充满挑战,AI创新更是任重道远。在其中,人的作用至关重要,专业素养、管理格局、创新思维缺一不可。LLM格局已定,具身智能浪潮已至,行业仍需持续创新,不断前行!