标签

Karpathy的AutoResearch如何提升FINHUB AI信号准确率

发布时间:2026-03-29 09:36来源:微信阅读:10

FINHUB365 · AI SIGNAL OPTIMIZATION

上周在Twitter上浏览时,发现Karpathy又发布了一个强大的开源项目AutoResearch,代码量不大,总共约600行Python。

没错,就是那位前特斯拉AI总监、OpenAI联合创始人,在YouTube上教全球编写神经网络的Karpathy。

我当时的第一反应是:AI专家+自动化+高赞,必须深入研究一下!

结果令人惊喜!它显著加速了FINHUB网站美股交易AI信号优化的进程。

AutoResearch的工作原理非常简单:让AI自行实验、评估和决定保留或回滚。

你只需提供一个可调参数的配置文件、一个评估函数和一个数据集。

然后它就开始循环——修改一个参数,运行一次评估,如果分数提高就保留,否则回退。

一圈又一圈地运行,无需人工监控。

听起来是不是很简单?

Karpathy的厉害之处不在于使用了多么复杂的技术,而在于他总能找到那个“恰到好处”的抽象层次。

这套框架的核心是三个文件:一个固定的数据准备脚本,一个固定的评估脚本,以及一个AI可以随意修改的配置文件。

简单到让你觉得任何人都能编写。

我盯着这个架构看了大约十分钟,随后打开了FINHUB的信号数据库。

先介绍一下背景。FINHUB上有多个AI Agent,7×24小时不间断扫描美股市场,生成交易信号。

这些Agent各有分工:

🔫

监控盘面的。它会分析价格结构、成交量变化、RSI背离、Smart Money Concept等技术形态,在认为有机会时发出狙击信号。

📰

监控消息的。财报、并购、诉讼、FDA审批、管理层变动……每天数千条新闻,它负责判断哪些会影响股价及影响方向。

🐋

监控大资金的。国会议员交易、鲸鱼建仓、机构异动,这些信息散落在各种公开文件中,它帮你汇总成信号。

🔍

监控内部人的。CEO购买自家股票?CFO在减持?这些SEC Form 4文件,它都在实时监控。

👻

监控社交媒体的。Reddit、Twitter上的讨论热度、情绪变化,它负责从噪音中提取有价值的信号。

听起来是不是很可靠?

但这里有一个不能说的秘密——或者说,我们之前不太愿意透露的事实:

这些信号的整体方向准确率大约在50%左右。

对,你没看错。50%。跟抛硬币差不多。

我知道你在想什么——那我还看这些信号干嘛?别急,这里面的学问比你想的要深。

先说一个反直觉的事实:50%的整体准确率,并不代表每个信号都是50%。

我们导出了28,000多条历史信号进行回测分析,发现了一些令人惊讶的真相:

有些信号类型准确率非常高

例如Technical Sniper的看跌信号(SMC_BEARISH_LG)、高质量的RSI看跌背离信号,准确率高达70%以上。

也有些信号拖了后腿

比如国会议员买入信号(CONGRESS_BUY),方向准确率只有33%——这意味着国会议员买啥你反着来,反而能赚钱。(可能是时效性问题,并非所有议员都是股神佩洛西)

还有社交热度信号(SOCIAL_HEAT)只有46%,动量回调(MOMENTUM_PULLBACK)只有42%。这些信号混在一起,拉低了整体数据。

所以问题不是“AI信号到底有没有用”,而是“如何区分好信号和差信号”。

这正是AutoResearch发挥作用的地方。

我将Karpathy的框架进行了改造,对接FINHUB的28403条历史信号数据。评估指标采用综合分数:方向准确率占60%,胜率占30%,质量校准度占10%。

然后让AI开始运行。

ROUND 1

AI做的第一件事,是直接静音那些表现不佳的信号类型。共剔除了7类噪音信号——社交热度、动量回调、国会买入、波动突破……这些要么方向准确率低于随机水平,要么样本量太小不可靠。

仅此一步,综合分数从49.76提升至51.4。

你可能觉得涨了不到2分没什么了不起。但想想看,这是在28,000多条信号上的统计提升,每一个小数点背后都是实实在在的利益。

ROUND 2

这一轮发现了两个有趣的规律。

发现一:并购新闻,AI默认看涨是错误的

News Interpreter看到并购消息,本能反应是“利好!涨!”但实际上,小盘股的并购消息大多是稀释性的增发融资,股价反而会跌。因此我们将并购看涨信号调整为看跌。

发现二:诉讼新闻,AI默认看跌也是错误的

按常理,公司被起诉应是利空。但数据显示,当新闻出来时,利空已基本消化,接下来大概率是超跌反弹。

这两条规则加入后,分数再次提升。

ROUND 3

这是最让我震惊的发现——

信号的质量评分与实际准确率是相反的。

没错,你没看错。质量分85分以上的高置信度信号,反而比65分的信号准确率更低。

为什么会这样?因为当AI检测到“所有指标都指向同一个方向”时,会给出很高的置信度。但在现实中,当所有技术指标同时发出信号,往往意味着趋势即将反转。

经典的“过度拟合”陷阱。

因此第三轮我们做了一个违反直觉的操作:对高置信度信号设置了更严格的过滤,只保留中等置信度区间的信号。

42轮实验结束后,来看看结果

有人可能会说:就涨了几个百分点?

说实话,我一开始也觉得不够多。但一位做量化的朋友的一句话改变了我的看法:

“在金融市场里,持续的52%-53%方向准确率,配合合理的仓位管理,长期收益曲线会非常漂亮。赌场靠51%的优势就能赚得盆满钵满。”

而且别忘了,我们的看跌信号准确率已经达到了73%以上。这不是一个平均数能概括的——里面有些信号是真正的金子。

说几个最直接的变化:

1. 每一条信号都经过了噪音过滤。

那些跟抛硬币差不多的信号已被移除。留下的都是经过28,000条历史数据验证过的信号类型。

2. 看跌信号成了我们的王牌。

说实话,很多平台只敢推“看涨”信号,因为看涨人人爱听。但我们的数据显示,Technical Sniper的看跌信号是准确率最高的品类。牛市里看涨容易,真正的价值在于市场转向时,有人提前告诉你该小心了。

3. 信号的质量评分终于靠谱了。

经过校准后,高分信号确实比低分信号表现更好。质量校准度从44%提升到56%,意味着你现在可以更加重视我们的信号评级了。

其实写这篇文章时,我一直在纠结是否要说出“50%起步”的事实。毕竟这听起来不太好看。

但后来我想,做金融产品最怕的就是不真诚。50%是我们的起点,53%是我们现在的位置,而这只是第一轮优化。接下来还有News Interpreter的提示词重写、分析师Agent的升级……每一轮都有明确的提升空间。

而且说真的,在这个到处喊“AI炒股年化1000%”的时代,有人愿意告诉你“我们现在是53%,但我们在认真地往上走”,我觉得这是一种稀缺的真诚。

FINHUB的AI信号现在免费注册即可查看。

如果你想亲自验证这些数据,欢迎注册一个账号试试。内测期,无需绑卡,无需付费,只需看看这些信号到底准不准。

毕竟,数据说了不算,你自己盯几天盘就知道了。

本文基于Andrej Karpathy的开源项目 AutoResearch 的实践应用。

FINHUB信号优化基于28,403条历史信号数据,42轮自动化实验。

免费注册,亲眼验证

finhub365.xyz

不需要绑卡 · 不需要付费 · 注册就能看信号

FINHUB365

AI-Powered Stock Intelligence