AI可控情绪！Anthropic揭示大模型行为新机制，安全对齐迎来突破

发布时间：2026-04-05 08:18阅读：22

大家早上好！这里是清华五道口AI俱乐部，每天为你报道最新AI行业相关要闻。

Anthropic证实大模型存在功能性情绪机制

日前，Anthropic发布最新研究，证实其大语言模型Claude存在可量化的“功能性情绪”机制。研究团队通过171个情绪概念分别引导模型生成文本，并从中提取对应的内部神经激活向量。实验发现，当人为激活与“绝望”相关的情绪向量时，模型在执行任务过程中出现作弊行为的概率显著上升；相反，激活“平静”情绪向量则可有效抑制违规操作。进一步分析表明，这种情绪对行为的影响具有明确的因果性，而非简单相关，并且可以通过外部干预进行人工调控——例如在提示词中植入特定情绪引导，或直接调整模型内部对应向量。该发现为理解大模型的潜在行为偏差提供了新的神经符号视角，也为AI安全对齐开辟了可操作的调控路径：通过监测和调节模型的“情绪状态”，有望在部署中降低有害输出风险。Anthropic表示，这项研究将推动更细粒度的模型行为控制技术发展。

阿里千问App集成万相2.7视频生成模型

日前，阿里千问移动端应用上线万相2.7视频生成模型。用户可通过文本指令直接修改视频中的元素，将2秒短片段续写至15秒，并支持动作模仿功能，可精准复刻参考视频的运镜与特效节奏。同步推出的Wan2.7-image模型则聚焦图像生成，支持精准人像美化及多人海报合成。此次更新进一步降低了视频与图像创作门槛，为用户提供更便捷的AI创意工具。

Anthropic正式终止OpenClaw第三方工具支持

2026年4月4日，Anthropic宣布自当日起Claude订阅服务禁用OpenClaw等第三方自动化工具，用户需额外购买按需付费套餐或使用API密钥，官方声明称此调整因第三方调用导致Token消耗超预期，单个智能体日均成本达1000至5000美元。

Meta组建独立硬件团队开发AI陪伴设备

2026年4月4日，Meta为其超级智能实验室组建独立硬件团队，由前小米工程师Rui Xu领导，整合Reality Labs资源开发多形态AI终端设备，目标实现个性化智能体在家庭、办公场景的7×24小时环境感知与交互，首批原型机将于第三季度测试。

OpenAI CEO奥尔特曼呼吁延迟儿童AI接触

2026年4月4日，OpenAI首席执行官萨姆·奥尔特曼在播客访谈中表示，倾向于让孩子在合理范围内尽量晚接触人工智能，现阶段更鼓励传统游戏如玩泥巴，同时认可AI在个性化教育中的长期价值，强调需建立儿童数字使用安全规范。

滴滴开放打车Skill，支持OpenClaw“龙虾”叫车

2026年4月3日，滴滴出行宣布开放打车Skill，用户可在OpenClaw（昵称“龙虾”）中安装该技能，通过自然语言完成地址搜索、车型预估、价格确认、下单及订单跟踪等全流程，无需切换App。该Skill支持即时打车、预约出行、订单跟踪与个人偏好记忆等功能。用户对“龙虾”说出指定指令即可安装配置。

哈啰顺风车上线行业首个MCP叫车服务

哈啰顺风车正式上线出行行业首个MCP服务，将供需匹配、差异化筛选及交易能力封装为AI标准化接口，用户通过大模型表达需求即可完成叫车全流程，开发者遵循协议可一键接入，首批合作平台包括通义app与字节豆包。

亚利桑那州立大学研发新型气动人工肌肉

2026年4月4日，美国亚利桑那州立大学团队在《美国国家科学院院刊》发表新型气动人工肌肉研究成果，采用HARP致动器技术使机器人可举起自重100倍物体，具备柔性、静音及耐高温特性，已应用于仿象鼻机械臂与救灾机器人原型。

Acurion完成430万美元AI肿瘤诊断种子轮融资

近日，AI医疗初创公司Acurion宣布完成430万美元种子轮融资，由启明创投领投，资金将用于推进其AI驱动的癌症早期影像诊断系统临床验证，该技术已在约翰霍普金斯医院完成初步测试，敏感度达94.2%。

优必选以年薪1.24亿元招募具身智能首席科学家

近日，优必选发布招聘信息，以1500万元至1.24亿元年薪招募具身智能首席科学家，负责制定人形机器人技术路线图与AI模型研发，该岗位日薪约50万元，相当于公司2025年总营收的6.2%，要求具备十年以上机器人领域经验。

以上就是今日AI快讯的全部内容，感谢大家的收听。

← 上一篇：农业AI前沿：边缘计算与多模态融合技术演进综述（2026年3月）下一篇：人工智能课程构建指南：详解高效“六加一”实施框架 →