AI算力版图剧变
近期人工智能领域最出人意料的消息,莫过于Anthropic与SpaceX的联手合作。5月6日,双方正式宣布:Anthropic将独占SpaceX的Colossus 1超级计算机全部算力,配备高达22万张英伟达GPU,预计本月内完成交付。颇具戏剧性的是,仅仅三个月前,马斯克还在社交媒体公开抨击Anthropic,指责其"仇视西方文明",AI"悲观且邪恶";而此次合作后,他转而称赞Anthropic团队"令人印象深刻",并宣称算力仅供给"确保AI有益于人类"的企业。谈及Anthropic,这家硅谷明星AI企业
宪法式训练:让AI自我对齐
AI 安全每日一篇 · Day 6用一套“宪法”训练 AIAnthropic 的 Constitutional AI——先给 AI 一组原则,再让它自己学会对齐· · ·先抛个有趣的设定。假设你要培养一个 AI 助手。你大概率已经听过 RLHF:请人类标注员阅读模型回答,并给分,告诉模型哪些回答“合格”、哪些“有问题”。但翻看昨天的论文,你会发现这条路存在不少麻烦——标注员主观偏差、评判尺度不一致、成本高且推进慢;更关键的是,当 AI 的能力超过人类,标注员往往也难以真正评判。所以你会想——能不能绕开人类