Karpathy的AutoResearch如何提升FINHUB AI信号准确率
FINHUB365 · AI SIGNAL OPTIMIZATION
上周在Twitter上浏览时,发现Karpathy又发布了一个强大的开源项目AutoResearch,代码量不大,总共约600行Python。
没错,就是那位前特斯拉AI总监、OpenAI联合创始人,在YouTube上教全球编写神经网络的Karpathy。
我当时的第一反应是:AI专家+自动化+高赞,必须深入研究一下!
结果令人惊喜!它显著加速了FINHUB网站美股交易AI信号优化的进程。
AutoResearch的工作原理非常简单:让AI自行实验、评估和决定保留或回滚。
你只需提供一个可调参数的配置文件、一个评估函数和一个数据集。
然后它就开始循环——修改一个参数,运行一次评估,如果分数提高就保留,否则回退。
一圈又一圈地运行,无需人工监控。
听起来是不是很简单?
Karpathy的厉害之处不在于使用了多么复杂的技术,而在于他总能找到那个“恰到好处”的抽象层次。
这套框架的核心是三个文件:一个固定的数据准备脚本,一个固定的评估脚本,以及一个AI可以随意修改的配置文件。
简单到让你觉得任何人都能编写。
我盯着这个架构看了大约十分钟,随后打开了FINHUB的信号数据库。
先介绍一下背景。FINHUB上有多个AI Agent,7×24小时不间断扫描美股市场,生成交易信号。
这些Agent各有分工:
🔫
监控盘面的。它会分析价格结构、成交量变化、RSI背离、Smart Money Concept等技术形态,在认为有机会时发出狙击信号。
📰
监控消息的。财报、并购、诉讼、FDA审批、管理层变动……每天数千条新闻,它负责判断哪些会影响股价及影响方向。
🐋
监控大资金的。国会议员交易、鲸鱼建仓、机构异动,这些信息散落在各种公开文件中,它帮你汇总成信号。
🔍
监控内部人的。CEO购买自家股票?CFO在减持?这些SEC Form 4文件,它都在实时监控。
👻
监控社交媒体的。Reddit、Twitter上的讨论热度、情绪变化,它负责从噪音中提取有价值的信号。
听起来是不是很可靠?
但这里有一个不能说的秘密——或者说,我们之前不太愿意透露的事实:
这些信号的整体方向准确率大约在50%左右。
对,你没看错。50%。跟抛硬币差不多。
我知道你在想什么——那我还看这些信号干嘛?别急,这里面的学问比你想的要深。
先说一个反直觉的事实:50%的整体准确率,并不代表每个信号都是50%。
我们导出了28,000多条历史信号进行回测分析,发现了一些令人惊讶的真相:
有些信号类型准确率非常高
例如Technical Sniper的看跌信号(SMC_BEARISH_LG)、高质量的RSI看跌背离信号,准确率高达70%以上。
也有些信号拖了后腿
比如国会议员买入信号(CONGRESS_BUY),方向准确率只有33%——这意味着国会议员买啥你反着来,反而能赚钱。(可能是时效性问题,并非所有议员都是股神佩洛西)
还有社交热度信号(SOCIAL_HEAT)只有46%,动量回调(MOMENTUM_PULLBACK)只有42%。这些信号混在一起,拉低了整体数据。
所以问题不是“AI信号到底有没有用”,而是“如何区分好信号和差信号”。
这正是AutoResearch发挥作用的地方。
我将Karpathy的框架进行了改造,对接FINHUB的28403条历史信号数据。评估指标采用综合分数:方向准确率占60%,胜率占30%,质量校准度占10%。
然后让AI开始运行。
ROUND 1
AI做的第一件事,是直接静音那些表现不佳的信号类型。共剔除了7类噪音信号——社交热度、动量回调、国会买入、波动突破……这些要么方向准确率低于随机水平,要么样本量太小不可靠。
仅此一步,综合分数从49.76提升至51.4。
你可能觉得涨了不到2分没什么了不起。但想想看,这是在28,000多条信号上的统计提升,每一个小数点背后都是实实在在的利益。
ROUND 2
这一轮发现了两个有趣的规律。
发现一:并购新闻,AI默认看涨是错误的
News Interpreter看到并购消息,本能反应是“利好!涨!”但实际上,小盘股的并购消息大多是稀释性的增发融资,股价反而会跌。因此我们将并购看涨信号调整为看跌。
发现二:诉讼新闻,AI默认看跌也是错误的
按常理,公司被起诉应是利空。但数据显示,当新闻出来时,利空已基本消化,接下来大概率是超跌反弹。
这两条规则加入后,分数再次提升。
ROUND 3
这是最让我震惊的发现——
信号的质量评分与实际准确率是相反的。
没错,你没看错。质量分85分以上的高置信度信号,反而比65分的信号准确率更低。
为什么会这样?因为当AI检测到“所有指标都指向同一个方向”时,会给出很高的置信度。但在现实中,当所有技术指标同时发出信号,往往意味着趋势即将反转。
经典的“过度拟合”陷阱。
因此第三轮我们做了一个违反直觉的操作:对高置信度信号设置了更严格的过滤,只保留中等置信度区间的信号。
42轮实验结束后,来看看结果
有人可能会说:就涨了几个百分点?
说实话,我一开始也觉得不够多。但一位做量化的朋友的一句话改变了我的看法:
“在金融市场里,持续的52%-53%方向准确率,配合合理的仓位管理,长期收益曲线会非常漂亮。赌场靠51%的优势就能赚得盆满钵满。”
而且别忘了,我们的看跌信号准确率已经达到了73%以上。这不是一个平均数能概括的——里面有些信号是真正的金子。
说几个最直接的变化:
1. 每一条信号都经过了噪音过滤。
那些跟抛硬币差不多的信号已被移除。留下的都是经过28,000条历史数据验证过的信号类型。
2. 看跌信号成了我们的王牌。
说实话,很多平台只敢推“看涨”信号,因为看涨人人爱听。但我们的数据显示,Technical Sniper的看跌信号是准确率最高的品类。牛市里看涨容易,真正的价值在于市场转向时,有人提前告诉你该小心了。
3. 信号的质量评分终于靠谱了。
经过校准后,高分信号确实比低分信号表现更好。质量校准度从44%提升到56%,意味着你现在可以更加重视我们的信号评级了。
其实写这篇文章时,我一直在纠结是否要说出“50%起步”的事实。毕竟这听起来不太好看。
但后来我想,做金融产品最怕的就是不真诚。50%是我们的起点,53%是我们现在的位置,而这只是第一轮优化。接下来还有News Interpreter的提示词重写、分析师Agent的升级……每一轮都有明确的提升空间。
而且说真的,在这个到处喊“AI炒股年化1000%”的时代,有人愿意告诉你“我们现在是53%,但我们在认真地往上走”,我觉得这是一种稀缺的真诚。
FINHUB的AI信号现在免费注册即可查看。
如果你想亲自验证这些数据,欢迎注册一个账号试试。内测期,无需绑卡,无需付费,只需看看这些信号到底准不准。
毕竟,数据说了不算,你自己盯几天盘就知道了。
本文基于Andrej Karpathy的开源项目 AutoResearch 的实践应用。
FINHUB信号优化基于28,403条历史信号数据,42轮自动化实验。
免费注册,亲眼验证
finhub365.xyz
不需要绑卡 · 不需要付费 · 注册就能看信号
FINHUB365
AI-Powered Stock Intelligence