Karpathy的AutoResearch如何提升FINHUB AI信号准确率

发布时间：2026-03-29 09:36阅读：19

FINHUB365 · AI SIGNAL OPTIMIZATION

上周在Twitter上浏览时，发现Karpathy又发布了一个强大的开源项目AutoResearch，代码量不大，总共约600行Python。

没错，就是那位前特斯拉AI总监、OpenAI联合创始人，在YouTube上教全球编写神经网络的Karpathy。

我当时的第一反应是：AI专家+自动化+高赞，必须深入研究一下！

结果令人惊喜！它显著加速了FINHUB网站美股交易AI信号优化的进程。

AutoResearch的工作原理非常简单：让AI自行实验、评估和决定保留或回滚。

你只需提供一个可调参数的配置文件、一个评估函数和一个数据集。

然后它就开始循环——修改一个参数，运行一次评估，如果分数提高就保留，否则回退。

一圈又一圈地运行，无需人工监控。

听起来是不是很简单？

Karpathy的厉害之处不在于使用了多么复杂的技术，而在于他总能找到那个“恰到好处”的抽象层次。

这套框架的核心是三个文件：一个固定的数据准备脚本，一个固定的评估脚本，以及一个AI可以随意修改的配置文件。

简单到让你觉得任何人都能编写。

我盯着这个架构看了大约十分钟，随后打开了FINHUB的信号数据库。

先介绍一下背景。FINHUB上有多个AI Agent，7×24小时不间断扫描美股市场，生成交易信号。

这些Agent各有分工：

🔫

监控盘面的。它会分析价格结构、成交量变化、RSI背离、Smart Money Concept等技术形态，在认为有机会时发出狙击信号。

📰

监控消息的。财报、并购、诉讼、FDA审批、管理层变动……每天数千条新闻，它负责判断哪些会影响股价及影响方向。

🐋

监控大资金的。国会议员交易、鲸鱼建仓、机构异动，这些信息散落在各种公开文件中，它帮你汇总成信号。

🔍

监控内部人的。CEO购买自家股票？CFO在减持？这些SEC Form 4文件，它都在实时监控。

👻

监控社交媒体的。Reddit、Twitter上的讨论热度、情绪变化，它负责从噪音中提取有价值的信号。

听起来是不是很可靠？

但这里有一个不能说的秘密——或者说，我们之前不太愿意透露的事实：

这些信号的整体方向准确率大约在50%左右。

对，你没看错。50%。跟抛硬币差不多。

我知道你在想什么——那我还看这些信号干嘛？别急，这里面的学问比你想的要深。

先说一个反直觉的事实：50%的整体准确率，并不代表每个信号都是50%。

我们导出了28,000多条历史信号进行回测分析，发现了一些令人惊讶的真相：

有些信号类型准确率非常高

例如Technical Sniper的看跌信号（SMC_BEARISH_LG）、高质量的RSI看跌背离信号，准确率高达70%以上。

也有些信号拖了后腿

比如国会议员买入信号（CONGRESS_BUY），方向准确率只有33%——这意味着国会议员买啥你反着来，反而能赚钱。（可能是时效性问题，并非所有议员都是股神佩洛西）

还有社交热度信号（SOCIAL_HEAT）只有46%，动量回调（MOMENTUM_PULLBACK）只有42%。这些信号混在一起，拉低了整体数据。

所以问题不是“AI信号到底有没有用”，而是“如何区分好信号和差信号”。

这正是AutoResearch发挥作用的地方。

我将Karpathy的框架进行了改造，对接FINHUB的28403条历史信号数据。评估指标采用综合分数：方向准确率占60%，胜率占30%，质量校准度占10%。

然后让AI开始运行。

ROUND 1

AI做的第一件事，是直接静音那些表现不佳的信号类型。共剔除了7类噪音信号——社交热度、动量回调、国会买入、波动突破……这些要么方向准确率低于随机水平，要么样本量太小不可靠。

仅此一步，综合分数从49.76提升至51.4。

你可能觉得涨了不到2分没什么了不起。但想想看，这是在28,000多条信号上的统计提升，每一个小数点背后都是实实在在的利益。

ROUND 2

这一轮发现了两个有趣的规律。

发现一：并购新闻，AI默认看涨是错误的

News Interpreter看到并购消息，本能反应是“利好！涨！”但实际上，小盘股的并购消息大多是稀释性的增发融资，股价反而会跌。因此我们将并购看涨信号调整为看跌。

发现二：诉讼新闻，AI默认看跌也是错误的

按常理，公司被起诉应是利空。但数据显示，当新闻出来时，利空已基本消化，接下来大概率是超跌反弹。

这两条规则加入后，分数再次提升。

ROUND 3

这是最让我震惊的发现——

信号的质量评分与实际准确率是相反的。

没错，你没看错。质量分85分以上的高置信度信号，反而比65分的信号准确率更低。

为什么会这样？因为当AI检测到“所有指标都指向同一个方向”时，会给出很高的置信度。但在现实中，当所有技术指标同时发出信号，往往意味着趋势即将反转。

经典的“过度拟合”陷阱。

因此第三轮我们做了一个违反直觉的操作：对高置信度信号设置了更严格的过滤，只保留中等置信度区间的信号。

42轮实验结束后，来看看结果

有人可能会说：就涨了几个百分点？

说实话，我一开始也觉得不够多。但一位做量化的朋友的一句话改变了我的看法：

“在金融市场里，持续的52%-53%方向准确率，配合合理的仓位管理，长期收益曲线会非常漂亮。赌场靠51%的优势就能赚得盆满钵满。”

而且别忘了，我们的看跌信号准确率已经达到了73%以上。这不是一个平均数能概括的——里面有些信号是真正的金子。

说几个最直接的变化：

1. 每一条信号都经过了噪音过滤。

那些跟抛硬币差不多的信号已被移除。留下的都是经过28,000条历史数据验证过的信号类型。

2. 看跌信号成了我们的王牌。

说实话，很多平台只敢推“看涨”信号，因为看涨人人爱听。但我们的数据显示，Technical Sniper的看跌信号是准确率最高的品类。牛市里看涨容易，真正的价值在于市场转向时，有人提前告诉你该小心了。

3. 信号的质量评分终于靠谱了。

经过校准后，高分信号确实比低分信号表现更好。质量校准度从44%提升到56%，意味着你现在可以更加重视我们的信号评级了。

其实写这篇文章时，我一直在纠结是否要说出“50%起步”的事实。毕竟这听起来不太好看。

但后来我想，做金融产品最怕的就是不真诚。50%是我们的起点，53%是我们现在的位置，而这只是第一轮优化。接下来还有News Interpreter的提示词重写、分析师Agent的升级……每一轮都有明确的提升空间。

而且说真的，在这个到处喊“AI炒股年化1000%”的时代，有人愿意告诉你“我们现在是53%，但我们在认真地往上走”，我觉得这是一种稀缺的真诚。

FINHUB的AI信号现在免费注册即可查看。

如果你想亲自验证这些数据，欢迎注册一个账号试试。内测期，无需绑卡，无需付费，只需看看这些信号到底准不准。

毕竟，数据说了不算，你自己盯几天盘就知道了。

本文基于Andrej Karpathy的开源项目 AutoResearch 的实践应用。

FINHUB信号优化基于28,403条历史信号数据，42轮自动化实验。

免费注册，亲眼验证

finhub365.xyz

不需要绑卡 · 不需要付费 · 注册就能看信号

FINHUB365

AI-Powered Stock Intelligence

← 上一篇：AI前沿观察 · 3月29日下一篇：智慧城市治理新趋势| 阿里云报告揭示AI在城市中的三大核心应用 →