标签

AI与量化:从同源到共生的必然逻辑

发布时间:2026-06-14 09:39阅读:1

约莫十载之前,美国顶尖量化做市商 Hudson River Trading(HRT)曾招募过一批实习生,共计十人。他们留下了一张极为普通的合影。十位青年,其中半数拥有华人面孔。

HRT 的录用门槛几近严苛:仅从 MIT、哈佛、斯坦福等名校选拔,专业限定于数学、物理、计算机,且基本只录用在 IMO(国际数学奥林匹克)、IOI(国际信息学奥赛)、IPhO(国际物理奥赛)等全球顶级赛事中斩获奖牌者。换言之,这十人是通过全球智力筛选机制层层过滤后得出的"最优解"。

十年光阴流转,这张照片背后至少诞生了三位亿万富翁,他们背后的公司或团队,估值动辄数百亿美元。中国读者最为熟知的包括 Alexandr Wang——Scale AI 的缔造者,现任职 Meta 的 AI 掌舵人;还有 Scott Wu,AI 编程工具 Devin 的幕后创始人,刚完成十亿美元级融资;以及 Jeffrey Yan,他将高频量化的极致性能移植至去中心化金融,其旗下的 Hyperliquid 平台估值曾超 400 亿美元。 - 此处便不再逐一标注,这并不重要。

一群十年前在量化交易室撰写策略的实习生,十年后在 AI 时代大放异彩。

这绝非巧合,亦非某种神秘的"风水"。这张照片真正揭示的是:人工智能时代最稀缺的人才,与量化交易最渴求的人才,实为同一类人。若顺着"人"这条线索深挖,会发现 AI 与量化共享的远不止人才——它们共享世界观、共享生产资料、共享问题结构,甚至共享同一套通往垄断的经济学逻辑。

本文旨在阐明两点。第一部分,剖析 AI 与量化为何是"天然孪生兄弟";第二部分,以中国量化行业绕不开的名字——幻方量化为样本,聚焦一个具体问题:一家私募基金,究竟凭借何种方法论、走了怎样的路径,将自己塑造成一个横跨量化与 AI 的"帝国"。

要厘清 AI 与量化的血缘,必须回溯至一人——詹姆斯·西蒙斯(Jim Simons),以及他于 1982 年创立的文艺复兴科技(Renaissance Technologies)。

西蒙斯本人是世界级数学家,曾从事密码破译,荣获几何学最高荣誉。他创立文艺复兴时做了一件当时被视为"离经叛道"之事:几乎不招募金融科班出身者。他招募的是数学家、物理学家、天文学家、统计学家、语音识别专家。其著名的旗舰基金 Medallion,在几十年间创造了人类金融史上几乎无法复制的回报率,而其逻辑核心仅有一句话——

不迷信任何人的"经验判断",只信赖数据中反复出现的统计规律。

在西蒙斯之前,华尔街主流是"基本面投资":分析师研究公司、剖析行业,依赖认知与判断下注。而西蒙斯的做法,本质上是将投资转化为一个模式识别问题:将市场海量历史数据输入数学模型,让模型自行从噪声中捕捉微弱但稳定的信号,进而放大、重复、规模化。

此刻,请回想深度学习是如何运作的。

神经网络的革命性,恰恰在于它摒弃了"专家手工设计规则"的范式。在深度学习之前,做图像识别需工程师手工设计"边缘检测器""角点检测器";做机器翻译需语言学家编写语法规则。而深度学习主张:无需编写规则,只需提供足够多的数据与算力,让网络自行从原始数据中学习特征。

发现了吗?西蒙斯在 1980 年代对金融所做的事,与深度学习在 2010 年代对人工智能所做的事,实为同一场革命:用数据驱动的统计学习,取代人类专家的显式规则。

量化投资,本质上是"机器学习"一词流行之前的机器学习。它只是恰好将这套方法论应用到了一个极具诱惑力、反馈极直接的领域——金融市场。两者共享同一认识论内核:世界的规律无需人来"理解",只需从数据中"拟合"而出。

若说世界观是软件,那么 AI 与量化运行在同一套硬件之上——它们争夺的是完全相同的三种生产资料。

第一种是数据。量化交易吞噬的是 tick 级行情、订单流、财报、舆情、卫星图像、信用卡流水;大模型吞噬的是整个互联网的文本、代码、图像、视频。两者均信奉一个朴素真理:数据的规模与质量,直接决定模型上限。谁能获取更多、更纯净、他人无法获取的数据,谁便拥有结构性优势。

第二种是算力。这是两者血缘关系最赤裸的体现。高频量化需在微秒级完成计算与下单,对硬件、网络、并行计算的压榨已达变态程度;而训练大模型对 GPU 集群的需求,更是直接将英伟达推至全球市值之巅。一家量化公司的机房,与一家 AI 公司的机房,外观几乎无异——皆是成片的 GPU、昂贵的网络互联、巨大的电力消耗。这也解释了为何,一家积累算力的量化公司,几乎可"零摩擦"地切换至大模型训练——它们的基础设施是通用的。

第三种是人才。我们回到开头那张 HRT 的合照。量化与 AI 争夺的是同一批人:数学、物理、计算机背景,竞赛金牌得主,对"用代码和数学解决问题"怀有近乎本能的热爱。这群人不在乎你是预测股价还是预测下一个 token,他们在乎的是问题是否足够艰难、智力是否足够过瘾、能否用最优雅的方法将看似无解的问题压缩为可优化的目标函数。因此,人才在量化与 AI 间的流动,从来不是"转行",而是"换了个数据集"。

再深入一层,AI 与量化解决的问题在数学结构上是同构的。

将其各自的工作流并列,你会发现惊人的对称:

量化中的"特征工程 / 因子挖掘",对应 AI 中的"特征学习 / 表征学习"——皆是从原始数据中提取具有预测力的信息。

量化中的"回测(backtest)",对应 AI 中的"训练集验证"——皆是用历史数据评估模型优劣。

量化最大的敌人"过拟合"(在历史数据上完美、一上实盘就亏损),恰恰也是机器学习最大的敌人"过拟合"(在训练集上满分、一遇新数据就拉胯)。两领域为对抗过拟合,所发明的武器几乎一致:正则化、交叉验证、样本外测试、控制模型复杂度。

更本质的是,两者都在做同一件事:在充满不确定性的世界中,最小化预测误差,优化目标函数。量化的目标函数是"风险调整后收益",AI 的目标函数是"损失函数最小"。但优化的数学语言、工程手段、踩过的坑,高度共通。一位顶级量化研究员与一位顶级机器学习研究员,其思维模式可无缝互译。

天然联系还体现在组织与商业逻辑上。

在组织文化上,顶级量化机构与顶级 AI 实验室,皆为"研究驱动"的扁平组织。它们都愿为长期、不确定回报的探索"烧钱";都崇尚 raw intelligence(原始智力)胜过行业资历;都容忍大量"看似浪费"的试错,因为它们深知,真正值钱的突破,往往藏于那些九败一胜的尝试中。这种文化,传统金融机构与软件公司难以复制。

在经济学上,两者皆遵循赢家通吃与规模复利的残酷逻辑。量化中,一个有效的 alpha(超额收益信号)一旦被多人发现即会失效,故必须不断投入、保持领先;AI 中,模型能力随数据、算力、参数规模指数级增长,头部玩家优势自我强化。两者皆无"小而美"的舒适区,皆是一场必须持续重仓、否则出局的军备竞赛。

而将两者真正焊死的,是一个我称之为"资本—算力飞轮"的机制:

量化交易能产生极其充沛、且与外部市场环境弱相关的现金流。这笔钱可源源不断购入 GPU、搭建超算集群。而这套超算集群,在为交易服务的同时,天然具备训练前沿大模型的全部物理条件。于是,一家量化公司可用交易所得,供养一支世界级 AI 团队与一座世界级算力中心——此事,恰恰是绝大多数纯 AI 创业公司即便用风险投资也未必烧得起的。

理解了这个飞轮,便能理解为何全球最前沿的 AI 突破之一,会从一家中国的量化私募中诞生。

我们也需诚实地指出:AI 与量化是孪生兄弟,却非同一人。它们至少在三点明显分叉,看懂这些差异,反而能更精准地理解其联系。

第一,反馈性质不同。量化交易面对的是对抗性、非平稳市场:你赚的钱是别人亏的钱,任何有效信号一旦被广泛使用即自我消解,市场规律随参与者行为漂移。而大模型面对的世界(语言、代码、图像背后的规律)虽也在变,但远不及金融市场"你一出手,规律即变"的强对抗性。这决定了量化必须不断迭代、永无止境,而 AI 的某些能力一旦学会便相对稳定。

第二,目标可定义性不同。量化的目标函数极其清晰——赚钱,且对错由市场每日用真金白银打分,反馈快、信号硬。而 AGI 的目标"什么是通用智能、怎样算更聪明"本身模糊,评估困难,需大量人为设计的基准与价值判断。

第三,时间尺度与社会影响不同。量化是相对私密的游戏,赚的是市场内部的钱;而大模型是面向全社会的基础设施,牵涉就业、教育、信息、安全乃至地缘政治。这也意味着,做 AI 需承受的外部审视、监管压力与社会责任,是做量化时未曾有过的。

承认这些差异,并不削弱"天然联系"的论断,反而使其更立体:量化为 AI 提供了世界观、生产资料与人才的"母体",但 AI 又是一个比量化更大、更难、更重的命题。能完成这场跨越的公司,必须既继承量化的全部能力,又有勇气走进一片更广阔也更凶险的水域。

讲幻方,易将其讲成"天才创业者梁文锋"的爽文故事。但本文重点非讲故事,而是挖掘方法论:幻方究竟做对了哪几个关键、反共识的决策,使其从一家普通私募,蜕变为能孵化出 DeepSeek 的技术帝国。

幻方的故事可追溯至 2008 年前后,梁文锋尚在浙江大学读书时,便与同学探讨用机器学习方法做量化交易。2015 年,幻方量化正式成立,旗下逐步形成宁波幻方量化、九章资产两家百亿级私募架构。

但创立公司并非关键,起点上的方法论选择才是。在中国量化行业早期,许多机构仍停留在"靠人写策略、靠经验调参数"阶段。幻方从一开始便押注一个更激进、更"重"的方向:全市场、全自动、以机器学习/深度学习为核心驱动的量化。这意味着它放弃了"基金经理凭判断下单"的舒适路径,选择了一条前期投入巨大、短期未必见效,但天花板极高的路。

这一选择,决定了幻方的基因从第一天起就不是"金融公司",而是"用 AI 做金融的科技公司"。其日后所有看似突兀的转向,实为这条起跑线的自然延伸。

要谈方法论,需先看清幻方究竟在做何种量化。其主体是股票二级市场量化投资,主力产品有两类:指数增强,满仓持有、在指数基础上靠选股获取超额收益;以及市场中性/对冲,用股指期货对冲市场整体涨跌的 beta,仅保留选股带来的纯 alpha。

一个细节可说明其超额来源:2024 年那波大盘权重股暴涨行情中,对冲产品因风格暴露反而受损,幻方一度收缩部分对冲产品线。这侧面印证了一件事——其超额主要来自中小盘、量价类 alpha,强行对冲反倒削损收益。

其公开描述的打法是一个"多频共存"策略矩阵,三层叠加:高频层捕捉盘口与日内微观波动,靠速度与市场微结构建模;中频层用价量因子叠加部分宏观数据做 alpha 预测,这是规模最大、最吃机器学习的一层;低频层则用深度学习模型做择时与资产配置。其主力引擎,常被概括为"量价 alpha + 日内择时"。

"量价"二字,是理解幻方的钥匙。其超额收益,绝大部分来自价格与成交量等高频、中频数据中的非线性模式,而非传统基本面财务因子。这决定了其走的是一条"数据密度极高、单个信号弱但足够稳定、靠规模与速度取胜"的路线,而非"深研几只股票、重仓押注"的路线。这条路线本身,便将其推向了对算力与模型的极度依赖——这也为后文一切埋下伏笔。

幻方与传统多因子私募最本质分野,在于其如何"造因子"。

传统多因子流程如下:人构思因子(动量、反转、波动率、估值……)→ 用线性模型给股票打分加权 → 形成组合。瓶颈死死卡在"人"身上——因子靠人经验拍脑袋,数量有限,且因子与收益间默认是线性关系。

幻方所做的,是将此流程尽可能交由机器,核心是两个互补动作。一是降维:原始量价数据维度极高、噪声极大,用深度网络将其压缩为有预测力的表征(representation),相当于让机器自己"长"出因子,不再依赖人逐个命名。二是升维与非线性:传统因子模型是线性的,而神经网络能将因子间非线性、交互效应、时序依赖统统建模——同一信号在牛市与熊市含义可能截然相反,线性模型抓不住,深度模型却能。

说到底,它将"人设计因子、线性组合"这套老范式,换成了"机器从原始量价里端到端学出预测信号"。这正是上篇所言"让数据说话"在量化工程上的精确落地,也是其日后能丝滑切入大模型的同一思维——无非是将预测对象,从"明天哪只股票涨"换成了"下一个 token 是什么"。

更能体现幻方"工业化"程度的,是其不仅限于"选股"一点用 AI,而是让机器学习贯穿从数据到成交每一环节。完整看,这条流水线至少含五道工序:

信号发现,从海量数据中挖掘有预测力的原始信号;信号增强,对信号去噪、组合、稳健化,将一堆弱信号炼为可用强信号;组合优化,在收益预测、风险约束、交易成本、行业与风格暴露间求最优持仓;交易执行,研究如何以最小冲击成本与滑点将目标仓位成交——这本身又是一个最优控制/机器学习问题;以及贯穿全程的风险管理,实时监控风格暴露、回撤与极端情形。每一道工序,幻方均上机器学习模型。

这意味着,幻方的壁垒从来不是"找到某个神奇因子",而是这五道工序每一处均做到工业级、且能持续快速迭代。真正拉开差距的,往往不是 alpha 创意,而是执行、成本、风控这些"不性感"环节。事实上它也非战无不胜——2021 年底,其产品曾遭遇历史极值级别回撤并公开致歉。这恰恰说明:再精密模型也躲不过风格失效与 alpha 衰减,能否扛住此类时刻、并快速迭代修复,才是真功夫所在。

若要在幻方发展史中只挑一个最关键、最反共识的决策,那一定是:它在一家私募"根本不需要"那么多算力时,便开始疯狂自建超算。

2019 年,梁文锋斥资 2 亿元,打造第一代 AI 集群"萤火一号",算力相当于约 4 万台个人电脑。紧接着,他又追加约 10 亿元,建成"萤火二号"——该集群配备一万张英伟达 A100 显卡,于 2021 年 1 月正式交付,提供 AI 算力达 325 PFLOPS(TF32),是萤火一号的十几倍。

请注意这个时间点与体量。2021 年,一万张 A100,对一家做量化的私募而言是严重"超配"。市面上普遍质疑:你一个炒股票的,要这么多卡干嘛?这些钱做别的不香吗?

但这恰恰是幻方方法论中最深刻的一点:它将算力视为一种长期增值的战略资产,而非需精打细算的成本。一万张 A100 在 2021 年看似奢侈,但当 2022 年底大模型时代骤临、全球疯抢 A100、甚至有钱也买不到卡时,幻方手中这座现成、已调试成熟的万卡集群,瞬间从"奢侈品"变为"诺亚方舟"。

这就是"算力先行"的战略价值:在风口到来前,将最稀缺、最难临时凑齐的生产资料囤在手中。当他人还在为算力发愁时,幻方已可直接开跑。

幻方最不像私募之处在于:其将自己当作一家 AI 基础设施公司运营,甚至专门设立 AI Lab、开设技术博客,还将一整套自研训练基础设施开源。透过这批开源项目,外界得以窥见其真正护城河——不在某条具体策略,而在工程效率本身。

这座"军火库"中,每一件都精准对应量化与 AI 工程中的真实瓶颈。HAI Platform 是其开源的集群调度系统,用"任务级分时共享"思路将零散算力整合再分配,能在 1500 多个计算节点上将日常算力占用率压至 95% 以上——GPU 极贵,闲置一秒即烧钱,该系统使命即不让一张卡空转。3FS(萤火文件系统)是高性能并行文件系统,节点间数据吞吐超 7TB/s,解决常被忽视的真相:训练瓶颈往往非算力本身,而是海量数据喂不进 GPU 时的 IO 堵塞。hfreduce 是自研多卡通信与梯度规约库,hfai.nn 则将常用深度学习算子针对自家硬件重写,连同对 PyTorch 深度优化,目标皆为榨干每一分硬件性能;ffrecord 则用统一高效存储格式,治愈海量小文件读取缓慢顽疾。

将这些拼合看,幻方"秘密"中很大一块,根本非策略,而是效率:同等算法创意,它能以更低成本、更快速度跑出,于是在单位时间内,它能比对手试错更多次、迭代更频繁。而在 alpha 快速衰减的市场里,迭代速度本身就是 alpha。这套压榨硬件、加速迭代的基本功,日后被几乎原封不动搬至大模型训练,成为 DeepSeek "低成本奇迹"的地基——这一点,后文还将详述。

支撑"算力先行"的,是一套更底层价值观,可概括为对"技术复利"的信仰。

复盘幻方每一步重大投入——2016 年前后对深度学习算法积累,2019 年起对算力基础设施下注,2023 年对 AGI(通用人工智能)转向——你会发现共同点:每一笔投入当下看都"不划算",但它们都在为更远未来蓄力。

梁文锋的逻辑是:真正有价值之物,需时间复利积累;若只盯季度收益、只做马上变现之事,永远拿不到那些"十年后才值钱"的东西。故他宁可在短期账面上"吃亏",也要将资源压在算法、算力、人才这些慢变量上。

这套"反短期主义"方法论,在浮躁资本市场中稀有。它解释了幻方为何敢在无人理解时建超算,也解释了其为何敢在量化做到千亿规模、本可"躺赚"时,毅然分出最优秀资源去做一件当时看不到任何商业回报之事——通用人工智能。

值得一提的是,幻方规模轨迹也印证了此打法成功:2019 年管理规模破百亿,2021 年一度破千亿大关,成为中国量化头部力量。正是量化业务持续输出现金流,为后来那场昂贵 AI 远征提供弹药。资本—算力飞轮,在幻方身上转得淋漓尽致。

幻方方法论中还有一条易被忽略、却极关键的暗线——其对"组织"的设计,本身就像在设计高效算法。

DeepSeek 出圈后,外界最惊讶事实之一是:完成这些世界级成果的核心团队,规模小得不可思议,且大量无海外大厂光环、刚毕业不久的年轻人。这不是巧合,而是刻意选择,背后是从量化继承来的两条原则。

第一条是"人才密度优先于人才数量"。顶级量化机构深知,研究突破来自极少数极聪明头脑间的高带宽碰撞,而非人海战术。百人的平庸团队,往往跑不赢十人的天才团队,因沟通成本与管理熵会吞掉规模红利。幻方将此信念贯彻至 AI:宁可只要最聪明那一小撮人,给其最好算力与最大自由,也不盲目扩张。

第二条是"去管理、重自驱"。在此类组织中,无层层审批科层结构,研究员可自行调动算力、定义解决问题、组队。管理者角色非"分配任务",而是"摆出最难问题,然后不挡路"。这种近乎"无为而治"的组织形态,恰恰是顶级量化实验室与 AI 实验室共同的隐秘配方——因真正创新无法被管理,只能被允许发生。

将组织视作需优化的系统设计,让信息与算力以最低摩擦在最聪明大脑间流动——这是幻方"工程师治司"另一面,也是其能用小团队办大事的结构性原因。

2023 年 4 月,幻方宣布成立新研究组织,正式开启探索 AGI 本质新征程。同年 7 月 17 日,承载此使命公司主体——杭州深度求索人工智能基础技术研究有限公司(DeepSeek)成立,梁文锋为实控人,持股 84.29%。

外界习惯称此步为"幻方转型"。但若读懂上篇"天然联系",便会明白:这绝非转型,而是惯性。

幻方做 AGI,用的是同一批数学、物理、计算机背景顶尖人才;跑在同一座为量化而建、却天然适配大模型训练的万卡集群上;遵循同一套"从数据学规律、优化目标函数"方法论;甚至前述那套调度、IO、通信、存储基础设施,皆可直接复用。它只是将这套能力,从"预测市场"目标函数,切换至"预测下一个 token、逼近通用智能"更大目标函数上。

对幻方而言,从量化到 AGI,非跳入陌生赛道,而是沿早已铺好轨道,多踩一脚油门。这正是"天然联系"在现实中最有力证据:当一家公司同时握有 AI 时代世界观、生产资料、组织文化与基础设施时,其跨界做大模型,顺理成章,非惊险一跃。

幻方/DeepSeek 真正让全球震动的,非"中国公司也能做大模型",而是其做大模型方式,带着浓烈量化基因——对工程效率与成本极致压榨。

2024 年 12 月,DeepSeek-V3 发布,性能比肩世界顶级模型,但其最出圈标签是训练成本:业界普遍报道核心训练成本仅约 560 万美元量级,远低于同级竞品。其通过 MoE(混合专家)架构、MLA(多头潜在注意力)等底层创新,及 FP8 低精度训练等工程手段,将"用更少资源,办成顶级事"做到极致。

这种对效率偏执,正是从高频量化继承本能。在高频交易世界,微秒即金钱,每一行代码开销、每次内存访问均需反复优化——因效率即利润,即 alpha。前述 HAI Platform、3FS、hfreduce 这套压榨硬件基本功,平移至大模型训练,结果便是:当他人靠"堆更多卡、烧更多钱"做模型时,DeepSeek 靠"榨干每张卡价值"做出同等甚至更强模型。

在算力被卡脖子现实约束下,这种"工程效率即护城河"打法,恰恰是中国 AI 最稀缺、最对路能力。而其源头,是量化。

幻方/DeepSeek 还有一套极具量化气质的"非共识打法"。

2025 年 1 月,DeepSeek 发布对标顶级闭源推理模型的 R1,并选择完全开源、可商用。随后,V3.1、V3.2 系列将"思考"能力延伸至工具调用与 Agent 场景。至 2026 年 4 月,DeepSeek 开源 V4 系列:1.6 万亿参数、原生百万 token 上下文、SWE-bench 高分,且 API 价格被打至每百万 token 仅 0.3 美元级,被业界再称"价格屠夫"。

开源、超低价、将最强能力免费或近乎免费交付——这在追求闭源垄断、高定价主流 AI 商业逻辑里,是彻头彻尾"非共识"。

但若熟悉量化,便觉此打法眼熟。量化超额收益,永远来自做"别人不做、不敢做、看不懂"之事。共识中无 alpha,alpha 仅存于非共识且正确判断中。幻方将此思维带入 AI:当所有人都往闭源、高价方向挤时,其选择用开源与极致低价重构行业成本曲线、争夺开发者生态人心。这是一种典型、用"做 alpha"方式做产品战略的打法。

故事讲至 2026 年,出现意味深长转折,亦是理解幻方方法论"进化"最新切片。

长期以来,梁文锋有着鲜明"任正非式"自立色彩:DeepSeek 背靠幻方现金流,其多次表态短期无融资计划,认为公司缺高端芯片,而非钱。这种"不靠外部资本、自我造血"姿态,几乎华为模式翻版。故当 2026 年 DeepSeek 启动首轮约 500 亿元、创纪录融资时,舆论用一妙标题——"梁文锋'不学'任正非了"。

此轮融资结构同样耐人寻味:据报道,梁文锋本人出资约 200 亿元,腾讯拟投约 100 亿元,宁德时代拟投约 50 亿元,投资方控制在 10 家以内,估值达数千亿元量级;与此同时,V4.1 版本定档当年 6 月。

为何一向"不差钱"幻方,此时打破原则融如此大笔钱?背后是方法论须应对两个新现实约束:

其一,人才战争。自 2025 年下半年起,DeepSeek 核心技术人员成各大科技巨头疯抢对象,总包从数千万至上亿元不等。而 DeepSeek 缺乏成熟股权激励机制,留人异常困难。引入外部资本、搭建股权激励,成守住人才这一最核心生产资料必要手段。

其二,算力"国产化迁徙"。据报道,V4 时代关键工程任务,是将训练与推理从英伟达 CUDA 生态,迁移至华为昇腾 CANN 体系——这是在芯片被卡脖子大背景下,不得不啃硬骨头,投入以亿元计。而前文那套高度自研、不依赖特定硬件生态基础设施,恰恰是其敢于做此迁移底气所在。

于是出现绝妙悖论:梁文锋"不学"任正非(开始接受外部融资),某种意义上恰恰为更好"学"华为(将算力底座迁移至国产昇腾、将命运攥回自己手中)。在外部资本与国产算力间,幻方做的依然是最像其选择:用一切可用资源,为"十年后值钱事"——自主可控算力与人才——继续重仓。

方法论未变,变的只是约束条件。而幻方应对约束方式,依旧是那套"算力先行、技术复利、长期主义、敢押非共识"组合拳。

我们绕一大圈,从十年前一张实习生合照,讲到文艺复兴西蒙斯,再讲到幻方与 DeepSeek 每一步路径选择。若将此压缩成一句话,即:

AI 与量化合流,非偶然跨界,乃必然归宗。

它们共享同一种"让数据说话"世界观,争夺同一批数据、算力与天才,求解同一类"在不确定中做预测"问题,遵循同一套赢家通吃经济学,并通过"资本—算力飞轮"将彼此焊为一体。当这些条件同时具备,量化通 AI、AI 反哺量化,水到渠成。

幻方价值,不在其为孤例,而在其为最纯粹证明:它证明"量化帝国"与"AI 帝国"底层是同一套能力——同一群人、同一机房、同一基础设施、同一种方法论,仅被先后用于两个不同目标函数。其做对那几件反共识之事——将量价数据弱信号用端到端深度学习榨成 alpha、将机器学习焊进选股至执行每道工序、将算力当战略资产而非成本、将工程效率压榨成开源也不怕护城河、用做 alpha 方式做非共识产品——每一件,皆是量化思维在 AI 时代延伸。

回到开头那张照片。十年前,那十位年轻人不知将走向何方。但今日我们已看清隐藏脉络:最聪明一批头脑,先在量化世界学会如何用数学与算力驯服不确定性,随后带着同一套武器,走进人工智能星辰大海。

这枚硬币两面,分都分不开。

注:本文涉及具体数据(如萤火集群规模、HAI Platform 与 3FS 等基础设施指标、DeepSeek 各版本参数与成本、2026 年融资细节等)综合自公开报道与幻方公开技术资料,部分数字为媒体披露口径,可能存在出入;文中不涉及幻方任何未公开策略细节,仅就公开信息做分析,不构成任何投资建议。