表情误用或致AI误判删档，AI巨头高管安全警报升级

发布时间：2026-04-27 18:40阅读：10

人工智能

美国国家安全局已在内部低调启用Anthropic旗下最强网络攻防模型Mythos。与此同时，白宫也在和联邦部门商议，如何在严格约束下开放Mythos，以保证其被安全使用，并明确该模型只应用于防御型网络安全、漏洞发现和系统加固等场景。阅读全文

美国企业Anthropic发布了一款名为Claude的AI桌面宠物硬件，所采用的是由深圳企业M5Stack生产的开源硬件M5StickC Plus。该设备可通过蓝牙连接电脑，展示AI运行状态，并让用户进行批准或驳回操作。虽然产品形态并不复杂，却反映出中国在物联网开发板供应链和快速交付方面的明显优势。阅读全文

全球AI 3D企业Meshy在创始人胡渊鸣带领下，于TCT Asia展会上亮相最新成果，吸引大量目光。过去两个月，Meshy已与多家头部3D打印厂商建立合作，并上线一站式创意工坊平台，打通从虚拟创作到实体生成的完整链路，显著降低创作门槛，用户规模突破千万，ARR年收入达到4000万美元，同比增长14倍。阅读全文

DeepSeek宣布，其V4产品将长期进行大幅降价，缓存命中价格再降至一折，实测结果显示编程成本最高可下降83%。这轮调价迅速引发行业震动，而在2024年，该公司就已凭借多种策略主导价格竞争。业内认为，此举将明显利好学生、AI入门者以及中小企业。阅读全文

斯坦福大学联合合作团队提出了名为LLM-as-a-Verifier的新型验证框架，并在AI编程基准Terminal-Bench上超过Claude Mythos和GPT-5.5，拿下当前最佳成绩。该方法通过细化评分维度、增加重复验证轮次以及拆分评估标准，显著提升了验证准确性，同时减少平局情况。Transformer论文作者Lukasz Kaiser和GAN作者Bing Xu也已转发并关注这项研究。阅读全文

近日，量子位专访了知名技术专家楼天城。他表示，当下人工智能的发展速度极快，犹如失控奔跑的野马，如何驾驭与约束已成为最紧迫的问题。楼天城同时强调，在这样的时代环境中，掌握关键技术与治理能力都十分重要。阅读全文

美国人工智能公司Anthropic旗下Claude Code服务因系统漏洞，导致用户在提交包含“HERMES.md”的Git记录时被错误扣费200多美元。虽然公司随后承认失误，并承诺退款及额外赔偿，但用户仍对其处理态度表示不满，认为问题只有在引发广泛关注后才会被认真解决。阅读全文

谷歌DeepMind推出了TIPSv2（Text-Image Pretraining with Spatial awareness v2），解决了视觉语言基础模型中图像块与文本嵌入难以对齐的问题，并在9项任务、20个数据集上取得优异表现。该成果已被CVPR 2026收录，相关代码、权重和资源也已全部开源。阅读全文

由胡渊鸣创办的Meshy AI推出了以AI驱动的3D模型生成平台，显著提升了建模效率与精度，在欧美市场受到广泛欢迎。公司凭借技术创新降低了3D建模门槛，并联合多家头部3D打印厂商，构建起从设计到制造的闭环服务，推动3D内容创作进入新阶段。阅读全文

苹果公司发布了一篇研究AI模型底层运行机制的论文，探讨大模型在处理信息时能否真正保障用户隐私。研究指出，即便到了最终输出层，模型仍可能泄露与任务无关却较为敏感的信息，这也加剧了外界对生成式AI安全性和隐私保护问题的担忧。阅读全文

西安交通大学、南洋理工大学与马萨诸塞大学阿默斯特分校的研究团队在ACL 2026会议上披露了大型语言模型中的表情符号语义混淆现象。实验结果显示，GPT、Claude等主流大模型的错误解析率最高可达38.6%，且超过90%的混淆回复会以“静默失败”形式出现，其中52%属于高危害等级，可能带来严重安全隐患。研究团队呼吁重视人机交互安全，推动AI系统更可靠地理解人类语言。阅读全文

全球AI竞争版图正逐步收缩为OpenAI与Anthropic的双强对决。两家公司围绕算力和算法展开激烈比拼，其中OpenAI依托英伟达GPU实现指数式扩张，而Anthropic则借助自研ASIC提升推理效率。虽然谷歌向Anthropic投入了400亿美元，希望借此扭转局势，但在AGI竞赛中其目前仍落在对手之后。阅读全文

最近，AI行业多位核心人物频繁遭遇安全威胁。OpenAI首席执行官奥特曼的住所遭到燃烧瓶袭击，英伟达创始人黄仁勋外出时也配备了保镖团队。这些事件折射出公众对AI技术的恐慌与忧虑正在持续上升，技术领军者正成为社会情绪对立中的重点目标。阅读全文

OpenAI宣布推出一项奖励计划，目标是发现并修补最新版GPT-5.5在生物领域可能存在的安全漏洞，防止人工智能被错误用于高风险研究。奖金规则及参与方式等信息已经在相关平台上公布。阅读全文

深圳创业公司其域创新在两年前推出了全球首个商用的大规模3D高斯模型移动端渲染产品XGRIDS LCC。尽管相关技术已经趋于成熟，但3DGS目前仍未在实际场景中大规模落地，主要瓶颈在于数据传输、加载性能以及生态支持不足。不过从近期案例来看，3D高斯泼溅正逐步从展示工具走向生产力工具，并在游戏、仿真训练和数字孪生等方向显现出应用潜力。阅读全文

← 上一篇：马斯克起诉 OpenAI：AGI 规则与主导权之争下一篇：AI面对黎曼猜想：它还会在哪些地方绊倒 →