投资AI公司：掌握三层模型，一眼看穿本质

发布时间：2026-05-10 08:19阅读：45

大家好，我是万象大叔。

深耕AI领域，剖析底层技术，洞察产业趋势，推动商业落地，布局投资方向。

各位，最近是不是被各种AI公司的BP（商业计划书）和路演搞得眼花缭乱？

个个都吹嘘自己拥有“世界级算法”、“海量数据”和“颠覆性场景”。作为技术出身的人，看这些不能光听故事，我们需要一套能穿透营销话术并直击本质的“解剖刀”。

今天我们就来聊聊如何像做技术尽职调查一样去评估一家AI公司。核心只有一个三层模型，从下往上，层层剥离。

这是最根本的一层。无论故事多么动听，AI公司最终都必须回答两个硬核问题：你的模型有多聪明？你的“燃料”（数据）有多独特、充足？

技术壁垒：是“真功夫”还是“调包侠”？

“你们的预训练模型，从头训练一轮的成本是多少？用了多少张显卡？耗时多久？”

“模型推理的每秒查询成本（Cost per Query）能做到多少？对比行业标杆（比如GPT-4o的API成本）是什么水平？”

“有没有针对特定场景（比如金融风控、生物计算）的独家模型架构或优化方法？有论文或专利吗？”

“核心团队的背景？是发顶会论文的学术大牛，还是有大规模分布式系统实战经验的工程老炮？”

核心问题：它的核心技术是自研的，还是基于开源模型（比如Llama、ChatGLM）微调的？如果是自研，创新点在哪？是架构创新（比如新的注意力机制），还是工程优化（比如更高效的训练/推理框架）？

关键洞察：现在大模型的基础架构（Transformer）已经高度开源和标准化。真正的技术壁垒越来越体现在工程能力上：比如，如何用更少的算力、更短的时间训出效果相当的模型？如何把千亿参数模型高效地部署上线，并控制推理成本？能把这套“脏活累活”干到极致的团队，才是真有壁垒。

必问清单：

“你们的预训练模型，从头训练一轮的成本是多少？用了多少张显卡？耗时多久？”

“模型推理的每秒查询成本（Cost per Query）能做到多少？对比行业标杆（比如GPT-4o的API成本）是什么水平？”

“有没有针对特定场景（比如金融风控、生物计算）的独家模型架构或优化方法？有论文或专利吗？”

“核心团队的背景？是发顶会论文的学术大牛，还是有大规模分布式系统实战经验的工程老炮？”

数据壁垒：是“活水”还是“一潭死水”？

“你们训练模型的主要数据来源是什么？占比各是多少？”

“有没有独特的、受法律保护的专有数据？（比如，医疗影像数据、工业质检数据、金融交易数据）”

“你们的业务本身能产生用于模型迭代的数据吗？数据标注和清洗的自动化程度如何？”

“数据隐私和安全合规是怎么做的？能过等保三级或类似审计吗？”

核心问题：你的数据从哪里来？是公开数据集、网络爬虫，还是独有的、高质量的、持续更新的业务闭环数据？

关键洞察：公开数据大家都能用，爬虫数据有法律和版权风险。最高阶的数据壁垒是“闭环数据飞轮”：产品/服务被用户使用 → 产生高质量交互数据 → 用这些数据反哺模型迭代 → 模型变好带来更多用户 → 产生更多数据。这个飞轮一旦转起来，别人很难追上。

必问清单：

“你们训练模型的主要数据来源是什么？占比各是多少？”

“有没有独特的、受法律保护的专有数据？（比如，医疗影像数据、工业质检数据、金融交易数据）”

“你们的业务本身能产生用于模型迭代的数据吗？数据标注和清洗的自动化程度如何？”

“数据隐私和安全合规是怎么做的？能过等保三级或类似审计吗？”

这一层的结论：如果一家公司只在算法微调上有小技巧，但数据和工程能力一般，其壁垒就像沙堡，一旦潮水（巨头或开源社区）袭来就会崩塌。真正有价值的是那些将顶尖工程能力与闭环数据飞轮结合起来的公司。

光自己强大是不够的，还要看它是否能够“组织”。这一层检查它是否具备平台化和构建生态的潜力，这是从“项目公司”走向“伟大公司”的关键转折点。

产品化与平台化：是“手工作坊”还是“流水线”？

“你们的收入中，标准化产品（如API调用、SaaS订阅）和定制化项目的占比各是多少？未来三年的目标趋势是什么？”

“产品的易用性如何？一个普通开发者需要多久能上手集成？”

“有没有成熟的开发者文档、SDK、管理后台？”

核心问题：它的技术是封装成标准化、可复用的产品（API、SDK、SaaS），还是只能靠项目团队人力堆？

关键洞察：做项目来钱快，但天花板低、规模不经济。产品化/平台化是估值跃升的核心。这意味着公司找到了可复制的商业模式，边际成本随着规模扩大而急剧下降。

必问清单：

“你们的收入中，标准化产品（如API调用、SaaS订阅）和定制化项目的占比各是多少？未来三年的目标趋势是什么？”

“产品的易用性如何？一个普通开发者需要多久能上手集成？”

“有没有成熟的开发者文档、SDK、管理后台？”

生态构建：是“自嗨”还是“众人拾柴”？

“开发者社区（如Discord、论坛）的日活/月活是多少？第三方应用或插件有多少？”

“头部合作伙伴有哪些？是简单的商务合作，还是基于你们的技术做了深度集成或二次开发？”

“有没有推出针对开发者的激励计划（如基金、流量扶持）？”

核心问题：有没有围绕其技术或产品，形成一个活跃的开发者社区、合作伙伴网络或应用市场？

关键洞察：生态是最高级的护城河。当大量开发者和合作伙伴在你的平台上开发应用、提供服务时，你就从“工具供应商”变成了“规则制定者”。用户的切换成本会变得极高。

必问清单：

“开发者社区（如Discord、论坛）的日活/月活是多少？第三方应用或插件有多少？”

“头部合作伙伴有哪些？是简单的商务合作，还是基于你们的技术做了深度集成或二次开发？”

“有没有推出针对开发者的激励计划（如基金、流量扶持）？”

这一层的结论：评估一家AI公司不能只看它赚多少钱，更要看它的产品化程度和生态雏形。成功搭建平台并启动生态飞轮的公司才有机会享受网络效应带来的指数级增长。

这是最现实的一层。无论技术多牛、平台多炫，如果不能赚钱都是空谈。这里要看它是否找到了一个“真需求、大市场、能赚钱”的切入点。

场景选择：是“伪需求”还是“真痛点”？

“你们聚焦的垂直行业是什么？在这个行业里深耕了多久？”

“目标客户是谁？他们为什么必须用你的产品？（不用会有什么损失？）”

“市场上已有的解决方案（包括人工方案）是什么？你们的方案效率/成本提升了多少？有客户案例数据吗？”

核心问题：它解决的是什么问题？这个问题是客户愿意持续付费的“痛点”，还是可有可无的“痒点”？

关键洞察：很多AI创业死在“技术找场景”。最好的AI公司往往是“场景倒逼技术”：先深刻理解某个垂直行业（如医疗、法律、制造）的痛点，再用AI技术去解决。场景的深度和壁垒，决定了公司的天花板。

必问清单：

“你们聚焦的垂直行业是什么？在这个行业里深耕了多久？”

“目标客户是谁？他们为什么必须用你的产品？（不用会有什么损失？）”

“市场上已有的解决方案（包括人工方案）是什么？你们的方案效率/成本提升了多少？有客户案例数据吗？”

商业化与财务健康度：是“烧钱机器”还是“赚钱引擎”？

“毛利率是多少？未来的提升空间在哪里？（是规模效应还是技术优化？）”

“获客成本（CAC）是多少？客户付费后的回收周期（Payback Period）是多长？”

“如果是SaaS，年度经常性收入（ARR）是多少？净收入留存率（NDR）是多少？大于120%吗？”

“未来的烧钱速度（Burn Rate）和现金流情况？距离盈亏平衡点还有多远？”

核心问题：怎么赚钱？单位经济模型（Unit Economics）跑通了吗？增长是健康的还是靠烧钱堆的？

关键洞察：尤其关注LTV/CAC（客户终身价值/获客成本）和毛利率。对于SaaS模式，还要看续费率、净收入留存率（NDR）。如果LTV远大于CAC，且毛利率高，说明商业模式健康。

必问清单：

“毛利率是多少？未来的提升空间在哪里？（是规模效应还是技术优化？）”

“获客成本（CAC）是多少？客户付费后的回收周期（Payback Period）是多长？”

“如果是SaaS，年度经常性收入（ARR）是多少？净收入留存率（NDR）是多少？大于120%吗？”

“未来的烧钱速度（Burn Rate）和现金流情况？距离盈亏平衡点还有多远？”

这一层的结论：必须用最严格的财务和商业眼光来审视。技术必须转化为可规模化的收入和健康的利润。一个在狭窄场景里高效赚钱的公司远比一个在宏大叙事里持续烧钱的公司更有价值。

最后提醒一下，这三层不是孤立的，要联动看：底层薄弱，中层和上层就是空中楼阁，随时可能崩塌。只有底层强，可能是个优秀的技术研究院，但成不了伟大的商业公司。中层（平台/生态）强，能极大放大底层技术的价值，并拓宽上层的商业化天花板。上层（场景/商业化）选得好，能反过来为底层提供独有的闭环数据，加固壁垒。

所以，我们的评估逻辑是：先看上层：它选择的赛道是否足够大、足够痛、能赚钱？（判断市场天花板和商业可行性）再看底层：它在这个赛道里，技术/数据壁垒是否足够深，能否守住阵地？（判断竞争护城河）最后看中层：它是否有可能从一个点突破，成长为平台或生态？（判断成长潜力和想象空间）

拿着这个三层模型和问题清单去跟创始人聊，基本就能摸清一家AI公司的成色。记住，在AI这个让人头晕的领域，静态优势不值钱，动态进化能力才值钱。我们要找的是那些地基扎实、正在从“独狼”向“狮王”进化、并且刀刀砍在黄金树上的公司。

← 上一篇：光芯共振：中国AI硬件长牛周期的底层逻辑与产业全景下一篇：真正的危险并非人工智能，而是背后的系统 →