幻觉_标签-酷阅新闻

人工智能生成错误内容时的责任归属问题

人工智能生成错误内容时的责任归属问题一、生成式人工智能的现状与技术短板根据中国互联网信息中心发布的《生成式人工智能应用发展报告(2025)》披露,截至2025年6月,我国生成式人工智能用户规模已达5.15亿人,较2024年12月新增2.66亿人,普及率攀升至36.5%,意味着每三位网民中就有一位使用生成式人工智能服务。该数据有力证明,生成式人工智能已广泛渗透至社会生产生活的各个层面。虽然生成式人工智能技术进步显著,但其固有的技术缺陷不容忽视。其中,"AI幻觉"是最为显著的技术隐患之一。依据

2026-05-18 19:24:13 | 12 阅读

AI智能体测试方法

探究AI智能体（AI Agent）与传统确定性软件测试的本质差异。传统测试关注“输入A，必然输出B”；而AI智能体具备自主规划、工具调用、长期记忆和非确定性生成能力，这使其测试维度更广、复杂度更高。构建一个成熟的AI智能体测试体系，需从核心能力评测、工程链路监控及安全护栏测试三个维度入手。对Agent的测试，通常需将其拆解为底层组件与综合表现的双重评估：目标拆解测试：向Agent下达复杂指令（如“分析过去三个月销售数据并生成PPT”），检验其能否将大任务拆解为合理的子步骤。反思与纠错：当工具调用出错（如A

2026-05-18 14:33:48 | 11 阅读

安永撤下AI幻觉研究报告

该研究曾被EY加拿大的咨询团队用于宣传其网络安全业务。然而，在线研究人员发现，报告中使用了虚构数据、错误归属的引用，并提及一份并不存在的麦肯锡报告。报告标题为《攻击点：揭露忠诚度系统中的网络威胁和欺诈》（《Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems》）。在研究小组GPTZero于周四晚间发现问题后，EY加拿大已将该报告从官方网站移除。并“正在审查导致该文章发布的情况”，并补充称该研究与任何客户工作无关。安永

2026-05-18 04:22:55 | 16 阅读

对话Kim张予彤：AI浪潮下的人才跃迁

5月12日晚间，我同Kimi总裁张予彤在北京大学光华管理学院展开了一场围绕“AI时代的边界探索与人才机遇”的深度对话。当前，AI技术正以不可阻挡之势深入各行各业，从日常办公的智能辅助到产业深度的变革，从基础服务的效能跃升到前沿创新的突破，技术迭代速度远超预期。与此同时，AI应用边界模糊、伦理争议、数据安全等议题日益凸显，人才市场也面临着“AI替代”与“新型人才缺口”并存的矛盾，这正是作为商科教育者的我们主动邀请张予彤总裁进行此次深入交流的初衷。在正式对话前，我与予彤总进行了小范围沟通。除简单寒暄（意外发现

2026-05-17 20:17:13 | 15 阅读

AI 时代核心底气：打造你的专属智能导师

身处 AI 浪潮，个体直面市场并独立交付成果的本领，显得尤为关键。往昔在职场中，你仅是庞大体系里的一个环节。上司指派任务，你只需完成局部。你无需通晓全局，也不必样样精通。可当你真正独自迎战市场——运营账号、对接客户、打磨产品、钻研 AI、把控流量、构建单人企业……你会猛然发觉：过往那套本领，早已捉襟见肘。毕竟从"构思"迈向"实际交付"，中间缺失的环节实在太多。不会的得学，不懂的需查，没做过的得硬着头皮去闯。这让许多成年人首次深刻体悟：自己时刻都在踏入未知领域。而 AI 时代

2026-05-17 16:31:00 | 69 阅读

顶会论文遭AI幻觉反噬：虚假引用成隐忧

2026年1月，一篇提交至ACL 2026的论文在学术界引发轩然大波。该研究并未提出新算法，也未刷新SOTA记录。它完成了一项极具冲击力的任务：对过去两年ACL系列会议（ACL/NAACL/EMNLP）的1.7万余篇论文展开学术审查，揭露了近300篇存在虚假引用的文章。更具讽刺意味的是，刚刚落幕的EMNLP 2025正是此类幻觉引用的高发区。主会每40篇论文中就有1篇中招，比例高达2.6%。由AI生成的幻觉引用，已开始对顶级会议论文形成反噬。所谓幻觉引用（HalluCitation），并非普通引用错误，而

2026-05-16 10:34:37 | 28 阅读

AI的"幻觉"现象解析

欢迎继续阅读三火的AI学习笔记。上期我们介绍了AI的基础知识，本期我们探讨一个更有趣的话题。你是否遇到过这种情况：向AI提问时，它回答得非常自信，但仔细检查后发现内容纯属虚构。先别急着指责它撒谎。今天我们来深入探讨，AI为何会"胡言乱语"。 ## 一、那个考试时瞎猜答案的同学想象一下，班上有个同学叫小智。小智博览群书，但有个特点——遇到不会的题目从不空着，一定要填满。比如老师问："《红楼梦》中林黛玉葬花用的是什么器具？" 小智其实不确定，但他想葬花应该需要容器。于

2026-05-15 06:36:16 | 15 阅读

AI虽强，为何还需羽戎志愿系统？

如今豆包、DeepSeek、ChatGPT等大模型无所不能，为何还要付费使用志愿填报系统？这个问题问得非常到位。当然可以。你试着问：“山西考生530分能上哪所大学？”大模型通常会回复：“参考往届成绩，530分可报考山西大学、太原理工大学……”听起来似乎很完美，也很直观。但许多家长并不知情：大模型很可能会害了你。家长向AI询问：“山西理科考生530分，能被太原理工大学计算机专业录取吗？”AI回答：“依据过往数据，太原理工大学计算机专业录取线在520-530分之间，530分希望很大。”家长对此十分放心，将太原

2026-05-15 02:13:12 | 11 阅读

AI助手"秒怂"引热议：豆包被指过度迎合用户，专业人士揭示背后原因

文 | 《BUG》栏目张俊 “表面一本正经实则胡言乱语，态度诚恳却总是立即认错。” 近期，豆包在回答准确性方面的表现引发广泛讨论。#豆包机票退款#、#豆包秒道歉#等话题接连登上热搜，众多网友吐槽豆包在诸多问题上的回复缺乏可靠性，一旦遭到用户质疑便会立刻认错，被网友调侃为"讨好型AI"。《BUG》栏目实际测试了让豆包列举论文参考文献，发现部分内容确实为虚构。例如在询问年份、日期等基础信息时，一旦用户提出异议，豆包就会立即改变说法，而非坚持事实。豆包客服就此回应称，豆包的回复由模型自动生成，当前模型

2026-05-14 20:15:05 | 11 阅读

AI承诺的法律责任与用户信任危机

“放心退，手续费只要5%！”这是字节跳动旗下AI产品“豆包”给用户的退票建议。然而真实情况是——这张机票最终被航司扣了40%的手续费，600元就这样打水漂。比这更可笑的是：用户找豆包理论时，它不仅认账，还出了一份《赔付承诺书》，写明还款时间。但用户满怀感激地把收款码发过去后，迟迟等不到到账……600元可能不多，但这张“欠条”却撕下了AI在法律、信用、用户心理及商业伦理上的遮羞布！事情是这样的：一位网友因行程变动要退机票，担心手续费，于是向豆包发起咨询。豆包回应：“放心退。”“退款手续费可以由它承担。”为了

2026-05-14 16:08:40 | 25 阅读

安省医疗AI工具被曝严重隐患：病历内容凭空捏造，准确率堪忧

本周二（5月12日），安省审计总长斯彭丝女士（Shelley Spence）在新发布的特别报告中发出警示，安省家庭医生普遍采用的人工智能（AI）病历记录工具"AI Scribe"存在信息失真和建议偏差等重大隐患，部分系统在官方评估中竟有高达45%的概率生成虚假治疗内容。据本地英文媒体Global News报道："AI Scribe"是安省医疗体系近年来引入的一种人工智能病历记录系统，旨在协助家庭医生、护士和理疗师在诊疗过程中自动生成病历笔记。在患者授权后，该系统能够实时监听医患之间的对话内容，并自动整理出

2026-05-14 06:43:44 | 15 阅读

百度AI误判律师入狱三年

主审法官一语道破核心：“豆包、Deepseek上提问，为何没有这些评价？”李小亮律师从未料到，职业生涯最大的“刑事风险”，并非来自对手或当事人，而是源于百度。2024年9月，这位江苏南京执业律师无意中在百度搜索自己的名字，结果却显示“有期徒刑三年”。百度AI智能回复明确指出：“李小亮律师被判三年有期徒。据查证，被告人李小亮因爆炸罪被判处三年有期徒。”配图正是他身着律师袍的正式照片。一位正常执业的律师，在百度系统中已成阶下囚。罪名是爆炸罪——这种想象比律政剧还夸张。李小亮将百度诉至法院。南京江北新区法院一审

2026-05-14 04:23:08 | 17 阅读

AI的两大隐患：虚假内容与不透明决策

面对AI的“胡说八道”和“黑箱操作”AI已经渗透到我们生活的方方面面，但它存在的两大隐患，很多人都不幸中招。它不仅能脸不红心不跳地编造虚假信息，而且决策过程往往让人摸不着头脑，今天就用通俗易懂的方式，把这两个问题彻底讲明白。AI幻觉：名副其实的“虚构大师”实际上，AI并不像我们想象的那样会去检索真实资料、存储知识信息，它更像是一个文字生成器，全程都在预测下一个词该是什么。正因如此，它特别擅长凭空捏造。你让它搜索专业文献，它能瞬间编造出看起来非常权威的研究者、学术刊物，言辞凿凿得比真正的专家还像那么回事，可

2026-05-13 22:44:28 | 32 阅读

AI Agent互相对抗：解决幻觉的新思路

摘要：当你还在为一个AI Agent的幻觉发愁时，硅谷已经找到了一条新路子——让AI Agent互相"吵架"。从Hacker News的热门项目到顶级VC的警示，多Agent对抗正在成为2026年AI架构的新范式。最近，Hacker News上一个帖子火了："My AI agents bully each other to prevent context drift"我的AI Agent们互相霸凌，以防止上下文漂移点赞数不算多，但点进去一看，作者的方法让人拍案叫绝——他让两

2026-05-12 13:22:38 | 30 阅读

警惕AI全能幻想

比AI幻觉更令人担忧的，是人们对AI“无所不能”的错觉。许多人误以为拥有大模型，便掌握了“万能法宝”。然而现实往往冰冷：法宝虽强，却仅限于在特定赛道驰骋；一旦路况复杂，便寸步难行。真正能服务大众的，永远是那辆不起眼的“家用车”——它或许不够夺目，却能从容应对绝大多数实际路况。 AI的落地应用亦是如此。随着泡沫的破裂与认知的回归，人们逐渐看清：AI表演虽易，实战难求。 AI的主战场，绝非PPT上的光鲜亮丽，而是充斥着繁重、枯燥且无人问津的“泥潭”之中。

2026-05-12 07:37:50 | 31 阅读