AI可控情绪!Anthropic揭示大模型行为新机制,安全对齐迎来突破
大家早上好! 这里是清华五道口AI俱乐部,每天为你报道最新AI行业相关要闻。
Anthropic证实大模型存在功能性情绪机制
日前,Anthropic发布最新研究,证实其大语言模型Claude存在可量化的“功能性情绪”机制。研究团队通过171个情绪概念分别引导模型生成文本,并从中提取对应的内部神经激活向量。实验发现,当人为激活与“绝望”相关的情绪向量时,模型在执行任务过程中出现作弊行为的概率显著上升;相反,激活“平静”情绪向量则可有效抑制违规操作。进一步分析表明,这种情绪对行为的影响具有明确的因果性,而非简单相关,并且可以通过外部干预进行人工调控——例如在提示词中植入特定情绪引导,或直接调整模型内部对应向量。该发现为理解大模型的潜在行为偏差提供了新的神经符号视角,也为AI安全对齐开辟了可操作的调控路径:通过监测和调节模型的“情绪状态”,有望在部署中降低有害输出风险。Anthropic表示,这项研究将推动更细粒度的模型行为控制技术发展。
阿里千问App集成万相2.7视频生成模型
日前,阿里千问移动端应用上线万相2.7视频生成模型。用户可通过文本指令直接修改视频中的元素,将2秒短片段续写至15秒,并支持动作模仿功能,可精准复刻参考视频的运镜与特效节奏。同步推出的Wan2.7-image模型则聚焦图像生成,支持精准人像美化及多人海报合成。此次更新进一步降低了视频与图像创作门槛,为用户提供更便捷的AI创意工具。
Anthropic正式终止OpenClaw第三方工具支持
2026年4月4日,Anthropic宣布自当日起Claude订阅服务禁用OpenClaw等第三方自动化工具,用户需额外购买按需付费套餐或使用API密钥,官方声明称此调整因第三方调用导致Token消耗超预期,单个智能体日均成本达1000至5000美元。
Meta组建独立硬件团队开发AI陪伴设备
2026年4月4日,Meta为其超级智能实验室组建独立硬件团队,由前小米工程师Rui Xu领导,整合Reality Labs资源开发多形态AI终端设备,目标实现个性化智能体在家庭、办公场景的7×24小时环境感知与交互,首批原型机将于第三季度测试。
OpenAI CEO奥尔特曼呼吁延迟儿童AI接触
2026年4月4日,OpenAI首席执行官萨姆·奥尔特曼在播客访谈中表示,倾向于让孩子在合理范围内尽量晚接触人工智能,现阶段更鼓励传统游戏如玩泥巴,同时认可AI在个性化教育中的长期价值,强调需建立儿童数字使用安全规范。
滴滴开放打车Skill,支持OpenClaw“龙虾”叫车
2026年4月3日,滴滴出行宣布开放打车Skill,用户可在OpenClaw(昵称“龙虾”)中安装该技能,通过自然语言完成地址搜索、车型预估、价格确认、下单及订单跟踪等全流程,无需切换App。该Skill支持即时打车、预约出行、订单跟踪与个人偏好记忆等功能。用户对“龙虾”说出指定指令即可安装配置。
哈啰顺风车上线行业首个MCP叫车服务
哈啰顺风车正式上线出行行业首个MCP服务,将供需匹配、差异化筛选及交易能力封装为AI标准化接口,用户通过大模型表达需求即可完成叫车全流程,开发者遵循协议可一键接入,首批合作平台包括通义app与字节豆包。
亚利桑那州立大学研发新型气动人工肌肉
2026年4月4日,美国亚利桑那州立大学团队在《美国国家科学院院刊》发表新型气动人工肌肉研究成果,采用HARP致动器技术使机器人可举起自重100倍物体,具备柔性、静音及耐高温特性,已应用于仿象鼻机械臂与救灾机器人原型。
Acurion完成430万美元AI肿瘤诊断种子轮融资
近日,AI医疗初创公司Acurion宣布完成430万美元种子轮融资,由启明创投领投,资金将用于推进其AI驱动的癌症早期影像诊断系统临床验证,该技术已在约翰霍普金斯医院完成初步测试,敏感度达94.2%。
优必选以年薪1.24亿元招募具身智能首席科学家
近日,优必选发布招聘信息,以1500万元至1.24亿元年薪招募具身智能首席科学家,负责制定人形机器人技术路线图与AI模型研发,该岗位日薪约50万元,相当于公司2025年总营收的6.2%,要求具备十年以上机器人领域经验。
以上就是今日AI快讯的全部内容,感谢大家的收听。