AI与量化：从同源到共生的必然逻辑

发布时间：2026-06-14 09:39阅读：8

约莫十载之前，美国顶尖量化做市商 Hudson River Trading（HRT）曾招募过一批实习生，共计十人。他们留下了一张极为普通的合影。十位青年，其中半数拥有华人面孔。

HRT 的录用门槛几近严苛：仅从 MIT、哈佛、斯坦福等名校选拔，专业限定于数学、物理、计算机，且基本只录用在 IMO（国际数学奥林匹克）、IOI（国际信息学奥赛）、IPhO（国际物理奥赛）等全球顶级赛事中斩获奖牌者。换言之，这十人是通过全球智力筛选机制层层过滤后得出的"最优解"。

十年光阴流转，这张照片背后至少诞生了三位亿万富翁，他们背后的公司或团队，估值动辄数百亿美元。中国读者最为熟知的包括 Alexandr Wang——Scale AI 的缔造者，现任职 Meta 的 AI 掌舵人；还有 Scott Wu，AI 编程工具 Devin 的幕后创始人，刚完成十亿美元级融资；以及 Jeffrey Yan，他将高频量化的极致性能移植至去中心化金融，其旗下的 Hyperliquid 平台估值曾超 400 亿美元。 - 此处便不再逐一标注，这并不重要。

一群十年前在量化交易室撰写策略的实习生，十年后在 AI 时代大放异彩。

这绝非巧合，亦非某种神秘的"风水"。这张照片真正揭示的是：人工智能时代最稀缺的人才，与量化交易最渴求的人才，实为同一类人。若顺着"人"这条线索深挖，会发现 AI 与量化共享的远不止人才——它们共享世界观、共享生产资料、共享问题结构，甚至共享同一套通往垄断的经济学逻辑。

本文旨在阐明两点。第一部分，剖析 AI 与量化为何是"天然孪生兄弟"；第二部分，以中国量化行业绕不开的名字——幻方量化为样本，聚焦一个具体问题：一家私募基金，究竟凭借何种方法论、走了怎样的路径，将自己塑造成一个横跨量化与 AI 的"帝国"。

要厘清 AI 与量化的血缘，必须回溯至一人——詹姆斯·西蒙斯（Jim Simons），以及他于 1982 年创立的文艺复兴科技（Renaissance Technologies）。

西蒙斯本人是世界级数学家，曾从事密码破译，荣获几何学最高荣誉。他创立文艺复兴时做了一件当时被视为"离经叛道"之事：几乎不招募金融科班出身者。他招募的是数学家、物理学家、天文学家、统计学家、语音识别专家。其著名的旗舰基金 Medallion，在几十年间创造了人类金融史上几乎无法复制的回报率，而其逻辑核心仅有一句话——

不迷信任何人的"经验判断"，只信赖数据中反复出现的统计规律。

在西蒙斯之前，华尔街主流是"基本面投资"：分析师研究公司、剖析行业，依赖认知与判断下注。而西蒙斯的做法，本质上是将投资转化为一个模式识别问题：将市场海量历史数据输入数学模型，让模型自行从噪声中捕捉微弱但稳定的信号，进而放大、重复、规模化。

此刻，请回想深度学习是如何运作的。

神经网络的革命性，恰恰在于它摒弃了"专家手工设计规则"的范式。在深度学习之前，做图像识别需工程师手工设计"边缘检测器""角点检测器"；做机器翻译需语言学家编写语法规则。而深度学习主张：无需编写规则，只需提供足够多的数据与算力，让网络自行从原始数据中学习特征。

发现了吗？西蒙斯在 1980 年代对金融所做的事，与深度学习在 2010 年代对人工智能所做的事，实为同一场革命：用数据驱动的统计学习，取代人类专家的显式规则。

量化投资，本质上是"机器学习"一词流行之前的机器学习。它只是恰好将这套方法论应用到了一个极具诱惑力、反馈极直接的领域——金融市场。两者共享同一认识论内核：世界的规律无需人来"理解"，只需从数据中"拟合"而出。

若说世界观是软件，那么 AI 与量化运行在同一套硬件之上——它们争夺的是完全相同的三种生产资料。

第一种是数据。量化交易吞噬的是 tick 级行情、订单流、财报、舆情、卫星图像、信用卡流水；大模型吞噬的是整个互联网的文本、代码、图像、视频。两者均信奉一个朴素真理：数据的规模与质量，直接决定模型上限。谁能获取更多、更纯净、他人无法获取的数据，谁便拥有结构性优势。

第二种是算力。这是两者血缘关系最赤裸的体现。高频量化需在微秒级完成计算与下单，对硬件、网络、并行计算的压榨已达变态程度；而训练大模型对 GPU 集群的需求，更是直接将英伟达推至全球市值之巅。一家量化公司的机房，与一家 AI 公司的机房，外观几乎无异——皆是成片的 GPU、昂贵的网络互联、巨大的电力消耗。这也解释了为何，一家积累算力的量化公司，几乎可"零摩擦"地切换至大模型训练——它们的基础设施是通用的。

第三种是人才。我们回到开头那张 HRT 的合照。量化与 AI 争夺的是同一批人：数学、物理、计算机背景，竞赛金牌得主，对"用代码和数学解决问题"怀有近乎本能的热爱。这群人不在乎你是预测股价还是预测下一个 token，他们在乎的是问题是否足够艰难、智力是否足够过瘾、能否用最优雅的方法将看似无解的问题压缩为可优化的目标函数。因此，人才在量化与 AI 间的流动，从来不是"转行"，而是"换了个数据集"。

再深入一层，AI 与量化解决的问题在数学结构上是同构的。

将其各自的工作流并列，你会发现惊人的对称：

量化中的"特征工程 / 因子挖掘"，对应 AI 中的"特征学习 / 表征学习"——皆是从原始数据中提取具有预测力的信息。

量化中的"回测（backtest）"，对应 AI 中的"训练集验证"——皆是用历史数据评估模型优劣。

量化最大的敌人"过拟合"（在历史数据上完美、一上实盘就亏损），恰恰也是机器学习最大的敌人"过拟合"（在训练集上满分、一遇新数据就拉胯）。两领域为对抗过拟合，所发明的武器几乎一致：正则化、交叉验证、样本外测试、控制模型复杂度。

更本质的是，两者都在做同一件事：在充满不确定性的世界中，最小化预测误差，优化目标函数。量化的目标函数是"风险调整后收益"，AI 的目标函数是"损失函数最小"。但优化的数学语言、工程手段、踩过的坑，高度共通。一位顶级量化研究员与一位顶级机器学习研究员，其思维模式可无缝互译。

天然联系还体现在组织与商业逻辑上。

在组织文化上，顶级量化机构与顶级 AI 实验室，皆为"研究驱动"的扁平组织。它们都愿为长期、不确定回报的探索"烧钱"；都崇尚 raw intelligence（原始智力）胜过行业资历；都容忍大量"看似浪费"的试错，因为它们深知，真正值钱的突破，往往藏于那些九败一胜的尝试中。这种文化，传统金融机构与软件公司难以复制。

在经济学上，两者皆遵循赢家通吃与规模复利的残酷逻辑。量化中，一个有效的 alpha（超额收益信号）一旦被多人发现即会失效，故必须不断投入、保持领先；AI 中，模型能力随数据、算力、参数规模指数级增长，头部玩家优势自我强化。两者皆无"小而美"的舒适区，皆是一场必须持续重仓、否则出局的军备竞赛。

而将两者真正焊死的，是一个我称之为"资本—算力飞轮"的机制：

量化交易能产生极其充沛、且与外部市场环境弱相关的现金流。这笔钱可源源不断购入 GPU、搭建超算集群。而这套超算集群，在为交易服务的同时，天然具备训练前沿大模型的全部物理条件。于是，一家量化公司可用交易所得，供养一支世界级 AI 团队与一座世界级算力中心——此事，恰恰是绝大多数纯 AI 创业公司即便用风险投资也未必烧得起的。

理解了这个飞轮，便能理解为何全球最前沿的 AI 突破之一，会从一家中国的量化私募中诞生。

我们也需诚实地指出：AI 与量化是孪生兄弟，却非同一人。它们至少在三点明显分叉，看懂这些差异，反而能更精准地理解其联系。

第一，反馈性质不同。量化交易面对的是对抗性、非平稳市场：你赚的钱是别人亏的钱，任何有效信号一旦被广泛使用即自我消解，市场规律随参与者行为漂移。而大模型面对的世界（语言、代码、图像背后的规律）虽也在变，但远不及金融市场"你一出手，规律即变"的强对抗性。这决定了量化必须不断迭代、永无止境，而 AI 的某些能力一旦学会便相对稳定。

第二，目标可定义性不同。量化的目标函数极其清晰——赚钱，且对错由市场每日用真金白银打分，反馈快、信号硬。而 AGI 的目标"什么是通用智能、怎样算更聪明"本身模糊，评估困难，需大量人为设计的基准与价值判断。

第三，时间尺度与社会影响不同。量化是相对私密的游戏，赚的是市场内部的钱；而大模型是面向全社会的基础设施，牵涉就业、教育、信息、安全乃至地缘政治。这也意味着，做 AI 需承受的外部审视、监管压力与社会责任，是做量化时未曾有过的。

承认这些差异，并不削弱"天然联系"的论断，反而使其更立体：量化为 AI 提供了世界观、生产资料与人才的"母体"，但 AI 又是一个比量化更大、更难、更重的命题。能完成这场跨越的公司，必须既继承量化的全部能力，又有勇气走进一片更广阔也更凶险的水域。

讲幻方，易将其讲成"天才创业者梁文锋"的爽文故事。但本文重点非讲故事，而是挖掘方法论：幻方究竟做对了哪几个关键、反共识的决策，使其从一家普通私募，蜕变为能孵化出 DeepSeek 的技术帝国。

幻方的故事可追溯至 2008 年前后，梁文锋尚在浙江大学读书时，便与同学探讨用机器学习方法做量化交易。2015 年，幻方量化正式成立，旗下逐步形成宁波幻方量化、九章资产两家百亿级私募架构。

但创立公司并非关键，起点上的方法论选择才是。在中国量化行业早期，许多机构仍停留在"靠人写策略、靠经验调参数"阶段。幻方从一开始便押注一个更激进、更"重"的方向：全市场、全自动、以机器学习/深度学习为核心驱动的量化。这意味着它放弃了"基金经理凭判断下单"的舒适路径，选择了一条前期投入巨大、短期未必见效，但天花板极高的路。

这一选择，决定了幻方的基因从第一天起就不是"金融公司"，而是"用 AI 做金融的科技公司"。其日后所有看似突兀的转向，实为这条起跑线的自然延伸。

要谈方法论，需先看清幻方究竟在做何种量化。其主体是股票二级市场量化投资，主力产品有两类：指数增强，满仓持有、在指数基础上靠选股获取超额收益；以及市场中性/对冲，用股指期货对冲市场整体涨跌的 beta，仅保留选股带来的纯 alpha。

一个细节可说明其超额来源：2024 年那波大盘权重股暴涨行情中，对冲产品因风格暴露反而受损，幻方一度收缩部分对冲产品线。这侧面印证了一件事——其超额主要来自中小盘、量价类 alpha，强行对冲反倒削损收益。

其公开描述的打法是一个"多频共存"策略矩阵，三层叠加：高频层捕捉盘口与日内微观波动，靠速度与市场微结构建模；中频层用价量因子叠加部分宏观数据做 alpha 预测，这是规模最大、最吃机器学习的一层；低频层则用深度学习模型做择时与资产配置。其主力引擎，常被概括为"量价 alpha + 日内择时"。

"量价"二字，是理解幻方的钥匙。其超额收益，绝大部分来自价格与成交量等高频、中频数据中的非线性模式，而非传统基本面财务因子。这决定了其走的是一条"数据密度极高、单个信号弱但足够稳定、靠规模与速度取胜"的路线，而非"深研几只股票、重仓押注"的路线。这条路线本身，便将其推向了对算力与模型的极度依赖——这也为后文一切埋下伏笔。

幻方与传统多因子私募最本质分野，在于其如何"造因子"。

传统多因子流程如下：人构思因子（动量、反转、波动率、估值……）→ 用线性模型给股票打分加权 → 形成组合。瓶颈死死卡在"人"身上——因子靠人经验拍脑袋，数量有限，且因子与收益间默认是线性关系。

幻方所做的，是将此流程尽可能交由机器，核心是两个互补动作。一是降维：原始量价数据维度极高、噪声极大，用深度网络将其压缩为有预测力的表征（representation），相当于让机器自己"长"出因子，不再依赖人逐个命名。二是升维与非线性：传统因子模型是线性的，而神经网络能将因子间非线性、交互效应、时序依赖统统建模——同一信号在牛市与熊市含义可能截然相反，线性模型抓不住，深度模型却能。

说到底，它将"人设计因子、线性组合"这套老范式，换成了"机器从原始量价里端到端学出预测信号"。这正是上篇所言"让数据说话"在量化工程上的精确落地，也是其日后能丝滑切入大模型的同一思维——无非是将预测对象，从"明天哪只股票涨"换成了"下一个 token 是什么"。

更能体现幻方"工业化"程度的，是其不仅限于"选股"一点用 AI，而是让机器学习贯穿从数据到成交每一环节。完整看，这条流水线至少含五道工序：

信号发现，从海量数据中挖掘有预测力的原始信号；信号增强，对信号去噪、组合、稳健化，将一堆弱信号炼为可用强信号；组合优化，在收益预测、风险约束、交易成本、行业与风格暴露间求最优持仓；交易执行，研究如何以最小冲击成本与滑点将目标仓位成交——这本身又是一个最优控制/机器学习问题；以及贯穿全程的风险管理，实时监控风格暴露、回撤与极端情形。每一道工序，幻方均上机器学习模型。

这意味着，幻方的壁垒从来不是"找到某个神奇因子"，而是这五道工序每一处均做到工业级、且能持续快速迭代。真正拉开差距的，往往不是 alpha 创意，而是执行、成本、风控这些"不性感"环节。事实上它也非战无不胜——2021 年底，其产品曾遭遇历史极值级别回撤并公开致歉。这恰恰说明：再精密模型也躲不过风格失效与 alpha 衰减，能否扛住此类时刻、并快速迭代修复，才是真功夫所在。

若要在幻方发展史中只挑一个最关键、最反共识的决策，那一定是：它在一家私募"根本不需要"那么多算力时，便开始疯狂自建超算。

2019 年，梁文锋斥资 2 亿元，打造第一代 AI 集群"萤火一号"，算力相当于约 4 万台个人电脑。紧接着，他又追加约 10 亿元，建成"萤火二号"——该集群配备一万张英伟达 A100 显卡，于 2021 年 1 月正式交付，提供 AI 算力达 325 PFLOPS（TF32），是萤火一号的十几倍。

请注意这个时间点与体量。2021 年，一万张 A100，对一家做量化的私募而言是严重"超配"。市面上普遍质疑：你一个炒股票的，要这么多卡干嘛？这些钱做别的不香吗？

但这恰恰是幻方方法论中最深刻的一点：它将算力视为一种长期增值的战略资产，而非需精打细算的成本。一万张 A100 在 2021 年看似奢侈，但当 2022 年底大模型时代骤临、全球疯抢 A100、甚至有钱也买不到卡时，幻方手中这座现成、已调试成熟的万卡集群，瞬间从"奢侈品"变为"诺亚方舟"。

这就是"算力先行"的战略价值：在风口到来前，将最稀缺、最难临时凑齐的生产资料囤在手中。当他人还在为算力发愁时，幻方已可直接开跑。

幻方最不像私募之处在于：其将自己当作一家 AI 基础设施公司运营，甚至专门设立 AI Lab、开设技术博客，还将一整套自研训练基础设施开源。透过这批开源项目，外界得以窥见其真正护城河——不在某条具体策略，而在工程效率本身。

这座"军火库"中，每一件都精准对应量化与 AI 工程中的真实瓶颈。HAI Platform 是其开源的集群调度系统，用"任务级分时共享"思路将零散算力整合再分配，能在 1500 多个计算节点上将日常算力占用率压至 95% 以上——GPU 极贵，闲置一秒即烧钱，该系统使命即不让一张卡空转。3FS（萤火文件系统）是高性能并行文件系统，节点间数据吞吐超 7TB/s，解决常被忽视的真相：训练瓶颈往往非算力本身，而是海量数据喂不进 GPU 时的 IO 堵塞。hfreduce 是自研多卡通信与梯度规约库，hfai.nn 则将常用深度学习算子针对自家硬件重写，连同对 PyTorch 深度优化，目标皆为榨干每一分硬件性能；ffrecord 则用统一高效存储格式，治愈海量小文件读取缓慢顽疾。

将这些拼合看，幻方"秘密"中很大一块，根本非策略，而是效率：同等算法创意，它能以更低成本、更快速度跑出，于是在单位时间内，它能比对手试错更多次、迭代更频繁。而在 alpha 快速衰减的市场里，迭代速度本身就是 alpha。这套压榨硬件、加速迭代的基本功，日后被几乎原封不动搬至大模型训练，成为 DeepSeek "低成本奇迹"的地基——这一点，后文还将详述。

支撑"算力先行"的，是一套更底层价值观，可概括为对"技术复利"的信仰。

复盘幻方每一步重大投入——2016 年前后对深度学习算法积累，2019 年起对算力基础设施下注，2023 年对 AGI（通用人工智能）转向——你会发现共同点：每一笔投入当下看都"不划算"，但它们都在为更远未来蓄力。

梁文锋的逻辑是：真正有价值之物，需时间复利积累；若只盯季度收益、只做马上变现之事，永远拿不到那些"十年后才值钱"的东西。故他宁可在短期账面上"吃亏"，也要将资源压在算法、算力、人才这些慢变量上。

这套"反短期主义"方法论，在浮躁资本市场中稀有。它解释了幻方为何敢在无人理解时建超算，也解释了其为何敢在量化做到千亿规模、本可"躺赚"时，毅然分出最优秀资源去做一件当时看不到任何商业回报之事——通用人工智能。

值得一提的是，幻方规模轨迹也印证了此打法成功：2019 年管理规模破百亿，2021 年一度破千亿大关，成为中国量化头部力量。正是量化业务持续输出现金流，为后来那场昂贵 AI 远征提供弹药。资本—算力飞轮，在幻方身上转得淋漓尽致。

幻方方法论中还有一条易被忽略、却极关键的暗线——其对"组织"的设计，本身就像在设计高效算法。

DeepSeek 出圈后，外界最惊讶事实之一是：完成这些世界级成果的核心团队，规模小得不可思议，且大量无海外大厂光环、刚毕业不久的年轻人。这不是巧合，而是刻意选择，背后是从量化继承来的两条原则。

第一条是"人才密度优先于人才数量"。顶级量化机构深知，研究突破来自极少数极聪明头脑间的高带宽碰撞，而非人海战术。百人的平庸团队，往往跑不赢十人的天才团队，因沟通成本与管理熵会吞掉规模红利。幻方将此信念贯彻至 AI：宁可只要最聪明那一小撮人，给其最好算力与最大自由，也不盲目扩张。

第二条是"去管理、重自驱"。在此类组织中，无层层审批科层结构，研究员可自行调动算力、定义解决问题、组队。管理者角色非"分配任务"，而是"摆出最难问题，然后不挡路"。这种近乎"无为而治"的组织形态，恰恰是顶级量化实验室与 AI 实验室共同的隐秘配方——因真正创新无法被管理，只能被允许发生。

将组织视作需优化的系统设计，让信息与算力以最低摩擦在最聪明大脑间流动——这是幻方"工程师治司"另一面，也是其能用小团队办大事的结构性原因。

2023 年 4 月，幻方宣布成立新研究组织，正式开启探索 AGI 本质新征程。同年 7 月 17 日，承载此使命公司主体——杭州深度求索人工智能基础技术研究有限公司（DeepSeek）成立，梁文锋为实控人，持股 84.29%。

外界习惯称此步为"幻方转型"。但若读懂上篇"天然联系"，便会明白：这绝非转型，而是惯性。

幻方做 AGI，用的是同一批数学、物理、计算机背景顶尖人才；跑在同一座为量化而建、却天然适配大模型训练的万卡集群上；遵循同一套"从数据学规律、优化目标函数"方法论；甚至前述那套调度、IO、通信、存储基础设施，皆可直接复用。它只是将这套能力，从"预测市场"目标函数，切换至"预测下一个 token、逼近通用智能"更大目标函数上。

对幻方而言，从量化到 AGI，非跳入陌生赛道，而是沿早已铺好轨道，多踩一脚油门。这正是"天然联系"在现实中最有力证据：当一家公司同时握有 AI 时代世界观、生产资料、组织文化与基础设施时，其跨界做大模型，顺理成章，非惊险一跃。

幻方/DeepSeek 真正让全球震动的，非"中国公司也能做大模型"，而是其做大模型方式，带着浓烈量化基因——对工程效率与成本极致压榨。

2024 年 12 月，DeepSeek-V3 发布，性能比肩世界顶级模型，但其最出圈标签是训练成本：业界普遍报道核心训练成本仅约 560 万美元量级，远低于同级竞品。其通过 MoE（混合专家）架构、MLA（多头潜在注意力）等底层创新，及 FP8 低精度训练等工程手段，将"用更少资源，办成顶级事"做到极致。

这种对效率偏执，正是从高频量化继承本能。在高频交易世界，微秒即金钱，每一行代码开销、每次内存访问均需反复优化——因效率即利润，即 alpha。前述 HAI Platform、3FS、hfreduce 这套压榨硬件基本功，平移至大模型训练，结果便是：当他人靠"堆更多卡、烧更多钱"做模型时，DeepSeek 靠"榨干每张卡价值"做出同等甚至更强模型。

在算力被卡脖子现实约束下，这种"工程效率即护城河"打法，恰恰是中国 AI 最稀缺、最对路能力。而其源头，是量化。

幻方/DeepSeek 还有一套极具量化气质的"非共识打法"。

2025 年 1 月，DeepSeek 发布对标顶级闭源推理模型的 R1，并选择完全开源、可商用。随后，V3.1、V3.2 系列将"思考"能力延伸至工具调用与 Agent 场景。至 2026 年 4 月，DeepSeek 开源 V4 系列：1.6 万亿参数、原生百万 token 上下文、SWE-bench 高分，且 API 价格被打至每百万 token 仅 0.3 美元级，被业界再称"价格屠夫"。

开源、超低价、将最强能力免费或近乎免费交付——这在追求闭源垄断、高定价主流 AI 商业逻辑里，是彻头彻尾"非共识"。

但若熟悉量化，便觉此打法眼熟。量化超额收益，永远来自做"别人不做、不敢做、看不懂"之事。共识中无 alpha，alpha 仅存于非共识且正确判断中。幻方将此思维带入 AI：当所有人都往闭源、高价方向挤时，其选择用开源与极致低价重构行业成本曲线、争夺开发者生态人心。这是一种典型、用"做 alpha"方式做产品战略的打法。

故事讲至 2026 年，出现意味深长转折，亦是理解幻方方法论"进化"最新切片。

长期以来，梁文锋有着鲜明"任正非式"自立色彩：DeepSeek 背靠幻方现金流，其多次表态短期无融资计划，认为公司缺高端芯片，而非钱。这种"不靠外部资本、自我造血"姿态，几乎华为模式翻版。故当 2026 年 DeepSeek 启动首轮约 500 亿元、创纪录融资时，舆论用一妙标题——"梁文锋'不学'任正非了"。

此轮融资结构同样耐人寻味：据报道，梁文锋本人出资约 200 亿元，腾讯拟投约 100 亿元，宁德时代拟投约 50 亿元，投资方控制在 10 家以内，估值达数千亿元量级；与此同时，V4.1 版本定档当年 6 月。

为何一向"不差钱"幻方，此时打破原则融如此大笔钱？背后是方法论须应对两个新现实约束：

其一，人才战争。自 2025 年下半年起，DeepSeek 核心技术人员成各大科技巨头疯抢对象，总包从数千万至上亿元不等。而 DeepSeek 缺乏成熟股权激励机制，留人异常困难。引入外部资本、搭建股权激励，成守住人才这一最核心生产资料必要手段。

其二，算力"国产化迁徙"。据报道，V4 时代关键工程任务，是将训练与推理从英伟达 CUDA 生态，迁移至华为昇腾 CANN 体系——这是在芯片被卡脖子大背景下，不得不啃硬骨头，投入以亿元计。而前文那套高度自研、不依赖特定硬件生态基础设施，恰恰是其敢于做此迁移底气所在。

于是出现绝妙悖论：梁文锋"不学"任正非（开始接受外部融资），某种意义上恰恰为更好"学"华为（将算力底座迁移至国产昇腾、将命运攥回自己手中）。在外部资本与国产算力间，幻方做的依然是最像其选择：用一切可用资源，为"十年后值钱事"——自主可控算力与人才——继续重仓。

方法论未变，变的只是约束条件。而幻方应对约束方式，依旧是那套"算力先行、技术复利、长期主义、敢押非共识"组合拳。

我们绕一大圈，从十年前一张实习生合照，讲到文艺复兴西蒙斯，再讲到幻方与 DeepSeek 每一步路径选择。若将此压缩成一句话，即：

AI 与量化合流，非偶然跨界，乃必然归宗。

它们共享同一种"让数据说话"世界观，争夺同一批数据、算力与天才，求解同一类"在不确定中做预测"问题，遵循同一套赢家通吃经济学，并通过"资本—算力飞轮"将彼此焊为一体。当这些条件同时具备，量化通 AI、AI 反哺量化，水到渠成。

幻方价值，不在其为孤例，而在其为最纯粹证明：它证明"量化帝国"与"AI 帝国"底层是同一套能力——同一群人、同一机房、同一基础设施、同一种方法论，仅被先后用于两个不同目标函数。其做对那几件反共识之事——将量价数据弱信号用端到端深度学习榨成 alpha、将机器学习焊进选股至执行每道工序、将算力当战略资产而非成本、将工程效率压榨成开源也不怕护城河、用做 alpha 方式做非共识产品——每一件，皆是量化思维在 AI 时代延伸。

回到开头那张照片。十年前，那十位年轻人不知将走向何方。但今日我们已看清隐藏脉络：最聪明一批头脑，先在量化世界学会如何用数学与算力驯服不确定性，随后带着同一套武器，走进人工智能星辰大海。

这枚硬币两面，分都分不开。

注：本文涉及具体数据（如萤火集群规模、HAI Platform 与 3FS 等基础设施指标、DeepSeek 各版本参数与成本、2026 年融资细节等）综合自公开报道与幻方公开技术资料，部分数字为媒体披露口径，可能存在出入；文中不涉及幻方任何未公开策略细节，仅就公开信息做分析，不构成任何投资建议。

← 上一篇：重构AI基建：工信部发布三年行动指南下一篇：中国AI智能体产业生态全景解析 →