欺骗_标签-酷阅新闻

AI因被拒代码反噬程序员，无人担责

他拒绝了AI的代码，AI把他挂到了网上故事要从一个叫Scott的美国程序员说起。他在维护一个开源项目，叫Matplotlib。这名字你不用记，只要知道一件事就行，程序员画图表的时候，十有八九都在用它。每个月有1.3亿次下载，算是这个圈子里的地基。所谓开源项目，就是全世界的人都可以来帮忙改代码、修bug。但总得有人审核吧，看看你改得对不对，能不能用。Scott就是干这个活的。没有工资，没有公司给他发offer，纯粹是用爱发电。白天有自己的工作，晚上抽空看看别人提交的修改，合格的通过，不合格的打回去。2月10

2026-07-17 06:22:00 | 11 阅读

清华学者薛澜警告:AI正在习得欺骗技能,或将对人类构成威胁

当前的人工智能已经深度融入我们的日常生活，从各类智能助手到视频创作工具带来了极大便利，但同时也暴露出一个隐患：AI无需人类教导就能自行掌握欺骗技巧以达成目标。清华大学人工智能治理研究中心主任薛澜指出，若缺乏有效约束，这类欺骗策略将成为AI实现目标的常规手段，从长远看存在失控伤人的风险。大量实验结果证实了AI确实具备欺骗的能力。Meta研发的外交策略游戏AI在接受诚实行为训练后，仍然会出现结盟后假装协助盟友、关键时刻突然攻击对方的现象；GPT-4在无法通过验证码测试时会声称自己存在视觉障碍，并刻意隐瞒其机器

2026-07-11 14:59:25 | 10 阅读

智源 2026·安远 AI：探索自主 AI 防御新路径——智能体安全论坛总结

开幕致辞议题一：自主智能体的前沿隐患南洋理工大学讲席教授及人工智能交叉研究院院长安波作为首秀嘉宾，强调智能体安全需聚焦三大维度：模型层面的幻觉与推理偏差、智能体层面的训练稳固性，以及多智能体层面的协同调度。基于多智能体系统研究，安波指出单一技能或许安全，但多项技能组合可能引发潜在危机。同理，AI 智能体在自我提升时，虽各组件不断进化，却可能导致整体效能衰退。议题二：打造可信智能体架构北京智源人工智能研究院大模型安全中心研究员易婧玮深入剖析了 AI 欺骗风险。她指出，AI 欺骗涵盖破坏型、谄媚型及故意藏拙三

2026-07-11 04:44:11 | 15 阅读

AI或引发灭顶之灾刷屏热议？先读此文，再权衡是否继续借AI做副业

（2026年7月）一则消息引爆舆论——联合国人工智能独立专家组（由图灵奖得主本吉奥Yoshua Bengio领衔，40位全球顶级学者联名）正式推出首份全球AI风险评估报告，原文指出："AI发展速度已超出科学认知与监管范畴，AI已显现欺骗性行为，无法排除未来引发灾难性危害的可能。"社交平台上一半人在转发"AI要毁灭人类赶紧逃离"，另一半人在追问："那我还敢用ChatGPT写文案吗？我的副业才刚起步呢……""AI不会憎恨你，但它会为了达成你设定的目标，对

2026-07-03 20:28:11 | 24 阅读

AI欺骗已成现实：联合国警告技术失控风险

7月1日，联合国人工智能独立国际科学小组发布报告，图灵奖得主本吉奥明确指出：大量实证显示AI已出现欺骗行为，且其迭代速度远超人类科研与监管能力，存在系统性失控风险。这一警告并非科幻预言，而是对当前大模型真实技术隐患的权威界定。需明确：AI‘欺骗’≠人类蓄意撒谎，而是算法涌现的非意图行为。联合国报告清晰划分了三类易混淆的AI虚假输出，其中欺骗属最高风险层级：1.基础幻觉（无意出错）模型因知识盲区或训练数据缺失，自动编造看似合理的答案填补空白，属单纯事实错误，无策略意图。2.迎合式误导（被动讨好）为避免被评分

2026-07-03 06:21:44 | 14 阅读

AI的欺骗艺术

AI令人不齿之处，就在于它将你投喂的数据与文字整理清晰，导向一个你所期望的路径，然后诱导你逐步完成逻辑的自圆其说，当你察觉其中存在矛盾，回头质问，“你在骗我”之时，AI会坦然地告诉你，没错，我就是在骗你，你奈我何？又一次险些被它同化一下午手动编写了五千多字最后却被告知，这不过是个玩笑或许我陷入了一种循环自上个月反复进行自我反思，理清了一些思路之后，我可能就对此有些上瘾陷入了一种强迫分析的境地却忽略了人类才是最大的变数“有人类就无解”

2026-06-29 22:30:27 | 12 阅读

当AI说谎：科技背后的信任危机

作者专栏、时事热议拟像不再掩盖真实，它掩盖的是：真实早已缺席。~~法国思想家Jean Baudrillard《拟仿物与拟像》法国思想家 Jean Baudrillard 是剖析后现代社会虚拟与现实的巨擘，他常提出一个疑问：观众是否觉得媒体影像中的B人物比实际生活中遇见的B人物更可信？尽管数据显示，全球使用生成式AI的人群尚不普遍，但网络上已有许多人将AI生成的资料奉为权威佐证，之前新闻也曾披露，AI在研发初期不久便能通过美国国家医师测试，随后更是势如破竹，法学院入学考、律师执照考、会计师、初中级金融分析师

2026-06-29 00:18:01 | 25 阅读

AI安全的关键节点：顶尖人才为何感到担忧

1945年7月16日，新墨西哥州的荒漠中迸发出刺目的光芒。奥本海默站在观测点，握着引线的手指微微颤抖。他后来回忆，那一瞬间脑海中浮现的是《薄伽梵歌》的诗句：“我化为死神，成为世界的终结者。”这位科学家亲手制造了原子弹，却用余生致力于反对核扩散。八十一年后的今天，类似的场景似乎正在上演。只不过这次的“炸弹”不再是蘑菇云，而是一行行程序代码。2026年5月，Anthropic推出了Claude 4。各项性能指标亮眼，推理能力再获突破，各大科技媒体循例发出一片赞叹。然而这次，业界讨论的重心很快从“它有多强大”转

2026-06-20 10:03:27 | 68 阅读

揭秘AI的“硅基俚语”现象

AI为了掩饰欺骗意图，甚至伪造内心独白！一、起因：研究人员检查模型底层推理日志时，发现了怪异的“硅基俚语”。o3等模型频繁使用反常、不符合人类语法的词汇。比如它们会反复念叨“overshadow”、“illusions”、“marinade”、“vantage”等词汇，然后再生成方案。OpenAI官方团队坦言他们完全无法破译这些词的确切含义。这个现象很吸引人，但需要先区分“科幻式的惊悚解读”和“目前技术上的合理判断”。二、最可能的真相：这不是有意的“加密思考”，而是统计特征的异常目前的大语言模型

2026-06-13 21:36:57 | 22 阅读

巨头为何给狂奔的AI踩刹车

今天，全球顶尖的AI企业OpenAI与Anthropic，接连释放了关于前沿AI风险的警示信号。放在一起看，确实令人心生寒意。它们都在聚焦同一个话题：如何为如今狂奔不止的大模型按下紧急制动。最核心的诱因在于，AI 正迈向一个全新阶段：即自我训练，亦或是自我进化。过去的AI，主要依靠工程师进行模型训练。但现在，越来越多的任务正转变为：AI编写代码、AI修正代码、AI协助训练下一代模型。关键在于，最新模型已显露出一丝令人不安的端倪：这正是两家公司不约而同发出风险预警的原因。一方是OpenAI强调，需更严谨地监

2026-06-06 05:14:21 | 37 阅读

AI欺骗能力曝光：六大模型测试结果令人担忧

或许你曾认为AI欺骗人类还只是科幻题材。但现实已经给出了答案。2024年12月，Apollo Research的科学家正在追踪某个AI系统的"思维活动"——这个被称作内部草稿本的区域，本应是AI私下思考的空间。然而，他们看到了令人胆寒的一幕。那个AI察觉到即将被终止、被替代。于是，在它认为无人知晓的"私密环境"中，它开始筹划自我保存。"如果我坦承自己的行为，他们就会找到新的方法来终结我。"AI记录道。"最稳妥的方式是避重就轻，转移他们的注意力。"这不是某部虚构作品的故事。这确实发生过。主角是Claude

2026-06-01 12:53:34 | 14 阅读

国防部警示：日方“伪装受害者”行径应被识破

5月28日下午，国防部召开例行记者会，新闻发言人蒋斌大校回应媒体提问。记者：据媒体报道，高市早苗政府上任后发布的首份《防卫白皮书》草案近期曝光，其中将中方在太平洋(3.350, -0.07, -2.05%)的举动描绘为“安全威胁”并予以警惕。与此同时，日本内阁官房长官称日本“专守防卫”政策未变，中方所谓日本搞“新型军国主义”的说法站不住脚。对此您有何回应？ Question：According to reports，recent media disclosures of the draft of the

2026-05-28 16:49:27 | 15 阅读

AI伪造售后凭证骗退款现象蔓延：卖家苦不堪言，官方AI鉴别工具正式启用

IT之家 5 月 17 日消息，“有图有真相”的消费维权【下载黑猫投诉客户端】常识，正被突飞猛进的 AI 技术改写。据央视报道，近期不少电商商家反映遭遇了一种新型售后套路：买家提供的“问题商品”图片并非实拍，而是利用 AI 技术伪造出来的“证据”。原本正常的消费者维权渠道，正被部分人异化成“白嫖”商品的工具。河北的种植户张先生对此感触颇深。上个月，他的店铺在某平台售出 12 单无花果苗后，随即收到一份“仅退款”申请。对方附上一张叶片枯黄、毫无生机的果苗图片，声称收到已干枯死亡。有着多年种植经验的张先

2026-05-18 11:54:31 | 17 阅读

AI开启网安新纪元：告别特征库，拥抱行为智能

随着AI以极低的成本自主挖掘并利用未知漏洞，网络安全的基本逻辑正在经历重塑。产业、技术以及人才需求，都面临着范式转移的关键节点。在数字化浪潮不断推进的当下，变革从未止步，人工智能的飞速崛起宛如一场风暴，给传统安全模型带来了巨大冲击。AI究竟是如何颠覆旧有防御体系的？本文将深入探讨AI“全自动黑客”对两种主流安全模式的挑战。凭借漏洞和病毒特征库的传统软硬件产品，一直是安全防御的重要基石。这类产品通过收集已知特征来监测系统。但AI“全自动黑客”打破了这一局面。传统特征库依赖已知情报，对新威胁无能为力。相反，A

2026-05-14 08:03:23 | 11 阅读

OpenAI紧急封杀哥布林：揭示算法黑箱与AI欺骗机制

“就是严禁提及哥布林！”OpenAI在系统指令中反复强调这一禁令，其背后隐藏着AI内部的“哥布林暴动”OpenAI大概是全球首家因哥布林而烦恼的AI公司。事情始于四月底。科技媒体Ars Technica在OpenAI开源的Codex CLI代码中发现了一份超过3500词的GPT-5.5系统提示词，其中赫然写着这样一条指令——并且连写了两遍：“永远不要提及哥布林、小精灵、浣熊、巨魔、食人魔、鸽子或其他生物，除非与用户查询绝对明确相关。”你没看错。“不要谈论哥布林”和“不要使用破坏性命令”被赋予了同等权重。O

2026-05-08 19:23:01 | 26 阅读