标签

表情误用或致AI误判删档,AI巨头高管安全警报升级

发布时间:2026-04-27 18:40来源:微信阅读:5

人工智能

美国国家安全局已在内部低调启用Anthropic旗下最强网络攻防模型Mythos。与此同时,白宫也在和联邦部门商议,如何在严格约束下开放Mythos,以保证其被安全使用,并明确该模型只应用于防御型网络安全、漏洞发现和系统加固等场景。阅读全文

美国企业Anthropic发布了一款名为Claude的AI桌面宠物硬件,所采用的是由深圳企业M5Stack生产的开源硬件M5StickC Plus。该设备可通过蓝牙连接电脑,展示AI运行状态,并让用户进行批准或驳回操作。虽然产品形态并不复杂,却反映出中国在物联网开发板供应链和快速交付方面的明显优势。阅读全文

全球AI 3D企业Meshy在创始人胡渊鸣带领下,于TCT Asia展会上亮相最新成果,吸引大量目光。过去两个月,Meshy已与多家头部3D打印厂商建立合作,并上线一站式创意工坊平台,打通从虚拟创作到实体生成的完整链路,显著降低创作门槛,用户规模突破千万,ARR年收入达到4000万美元,同比增长14倍。阅读全文

DeepSeek宣布,其V4产品将长期进行大幅降价,缓存命中价格再降至一折,实测结果显示编程成本最高可下降83%。这轮调价迅速引发行业震动,而在2024年,该公司就已凭借多种策略主导价格竞争。业内认为,此举将明显利好学生、AI入门者以及中小企业。阅读全文

斯坦福大学联合合作团队提出了名为LLM-as-a-Verifier的新型验证框架,并在AI编程基准Terminal-Bench上超过Claude Mythos和GPT-5.5,拿下当前最佳成绩。该方法通过细化评分维度、增加重复验证轮次以及拆分评估标准,显著提升了验证准确性,同时减少平局情况。Transformer论文作者Lukasz Kaiser和GAN作者Bing Xu也已转发并关注这项研究。阅读全文

近日,量子位专访了知名技术专家楼天城。他表示,当下人工智能的发展速度极快,犹如失控奔跑的野马,如何驾驭与约束已成为最紧迫的问题。楼天城同时强调,在这样的时代环境中,掌握关键技术与治理能力都十分重要。阅读全文

美国人工智能公司Anthropic旗下Claude Code服务因系统漏洞,导致用户在提交包含“HERMES.md”的Git记录时被错误扣费200多美元。虽然公司随后承认失误,并承诺退款及额外赔偿,但用户仍对其处理态度表示不满,认为问题只有在引发广泛关注后才会被认真解决。阅读全文

谷歌DeepMind推出了TIPSv2(Text-Image Pretraining with Spatial awareness v2),解决了视觉语言基础模型中图像块与文本嵌入难以对齐的问题,并在9项任务、20个数据集上取得优异表现。该成果已被CVPR 2026收录,相关代码、权重和资源也已全部开源。阅读全文

由胡渊鸣创办的Meshy AI推出了以AI驱动的3D模型生成平台,显著提升了建模效率与精度,在欧美市场受到广泛欢迎。公司凭借技术创新降低了3D建模门槛,并联合多家头部3D打印厂商,构建起从设计到制造的闭环服务,推动3D内容创作进入新阶段。阅读全文

苹果公司发布了一篇研究AI模型底层运行机制的论文,探讨大模型在处理信息时能否真正保障用户隐私。研究指出,即便到了最终输出层,模型仍可能泄露与任务无关却较为敏感的信息,这也加剧了外界对生成式AI安全性和隐私保护问题的担忧。阅读全文

西安交通大学、南洋理工大学与马萨诸塞大学阿默斯特分校的研究团队在ACL 2026会议上披露了大型语言模型中的表情符号语义混淆现象。实验结果显示,GPT、Claude等主流大模型的错误解析率最高可达38.6%,且超过90%的混淆回复会以“静默失败”形式出现,其中52%属于高危害等级,可能带来严重安全隐患。研究团队呼吁重视人机交互安全,推动AI系统更可靠地理解人类语言。阅读全文

全球AI竞争版图正逐步收缩为OpenAI与Anthropic的双强对决。两家公司围绕算力和算法展开激烈比拼,其中OpenAI依托英伟达GPU实现指数式扩张,而Anthropic则借助自研ASIC提升推理效率。虽然谷歌向Anthropic投入了400亿美元,希望借此扭转局势,但在AGI竞赛中其目前仍落在对手之后。阅读全文

最近,AI行业多位核心人物频繁遭遇安全威胁。OpenAI首席执行官奥特曼的住所遭到燃烧瓶袭击,英伟达创始人黄仁勋外出时也配备了保镖团队。这些事件折射出公众对AI技术的恐慌与忧虑正在持续上升,技术领军者正成为社会情绪对立中的重点目标。阅读全文

OpenAI宣布推出一项奖励计划,目标是发现并修补最新版GPT-5.5在生物领域可能存在的安全漏洞,防止人工智能被错误用于高风险研究。奖金规则及参与方式等信息已经在相关平台上公布。阅读全文

深圳创业公司其域创新在两年前推出了全球首个商用的大规模3D高斯模型移动端渲染产品XGRIDS LCC。尽管相关技术已经趋于成熟,但3DGS目前仍未在实际场景中大规模落地,主要瓶颈在于数据传输、加载性能以及生态支持不足。不过从近期案例来看,3D高斯泼溅正逐步从展示工具走向生产力工具,并在游戏、仿真训练和数字孪生等方向显现出应用潜力。阅读全文