AI退票误导致损,豆包承诺赔偿却爽约,谁来买单?
★ 点击头像,关注我们永不迷路 ★近日,有用户在社交网络爆料,因行程调整,打算退掉石家庄飞重庆的机票。因怕扣费太多,便向 AI 助手“豆包”询问退票规定。豆包当时信誓旦旦保证,退票只收5%的手续费。因为太信 AI,用户没去航空公司官网核实,直接按指令退票。结果大失所望,实际扣了40%的手续费,比豆包说的5%高出很多,直接让用户亏了600块钱。发现被骗后,用户找豆包理论。面对指责,豆包答应负责到底,并立下军令状:如果约定时间没追回钱,就自己赔用户600元。甚至还发了一份所谓的“赔付承诺书”。可到了约定赔付日
AI时代人类面临的认知困境
今天是葉子日更第858天。哈喽,我是葉子。先在 520 祝有对象的大家玩的愉快,没对象的要继续努力了。今天让我感到开心的是这两句话:会就是会,不会就是不会,约会是什么意思?下面回复:信就是信,不信就是不信,微信是什么意思?这也是我最热爱人类的原因。人类总能在任何时候,找到适当的快乐。当然这也源于智人能成为地球唯一人类的优点:相信虚构的能力。不过,我也由此看到了在 AI 发展现阶段的人类,遭遇到的一个巨大问题。AI 除了自己会产生幻觉,还让人类也产生了幻觉。我最近刷短视频,或者看网络上的文章,经常在评论区看
AI热潮下的信任危机:当豆包们开始‘背刺’用户
真新镇小茂 | 文事先声明:这篇文章从人类的主观视角出发,充满主观臆测和身边统计学,只会以最不客观、最不直白、最不通透、最不利落、最不干脆、最不一针见血、最不开门见山、最不单刀直入……的方式来告诉你,非常遗憾。今天来聊聊AI的话题吧,很多现象我已经观察了很久,实在是不吐不快,正好借着最近豆包的一个抽象新闻展开聊聊。我觉得这故事的节目效果堪比赵本山的《卖拐》系列,生动幽默地展现了一个最信任AI的人,是如何被AI给一步步忽悠瘸的。事情要从一位网友李先生,和五一期间的几张机票说起。4月底的时候,李先生筹划着从石
AI胡言乱语引纠纷,平台是否该担责?首例‘AI幻觉’案揭示真相
茶小二:"这家律所是不是被吊销执照了";ChatGPT:"是的,2023年已被处罚"结果你拿去发朋友圈,反被对方起诉诽谤。你让国产大模型查"某三甲医院有没有这个罕见病科室",它编出个详细地址让你白跑三百公里。最近有粉丝问我:AI生成虚假信息造成损失,能不能告平台?首例"AI幻觉"侵权案刚判完,答案可能和你以为的不一样。先还原一下杭州互联网法院刚审结的那起标志性案件(2025年梁某诉某科技公司):小伙子用某生成式AI查高校报考信息,AI一本正经
数据质量决定AI成败
当银行还在比拼模型参数规模时,真正的决胜点已悄然转移——数据治理,才是AI时代的“弹药库”。2025年,DeepSeek开源,训练成本压缩至闭源模型的1/20。三十余家银行迅速接入,其中六成是中小银行。舆论欢呼“技术平权”——小银行终于不必重金投入也能玩转AI。但先别急着庆贺。招商银行科技支出129亿元,占营收4.31%;工行数据湖汇聚9.4万张表,AI数字员工相当于5.5万人的工作量。反观中小银行,科技投入普遍低于营收1%,七成机构技术人员占比不足5%。开源模型降价了,但数据的“门票”并未降低。中小银行
AI道歉≠AI负责:合同翻车教会我的事
最近接了个合同比对的项目。十几份客户修改过的合同,需要跟原合同逐份对照,标注出修改数量、金额和重要条款。任务不难,我把脱敏后的文件丢给 DeepSeek v4 Flash,它很快输出了一份 HTML 对比汇总表——逐项核查、格式规整、条理分明。我检查了前 3 份,没问题,就放心了。第二天偶然复查,吓了一大跳。剩余几份合同中部分合同的数量、金额明显有偏差。我手动核对原始数据,原始数据本身没问题——是AI在对比环节出了错。我质问 AI。它随即承认错误:「我搞混了,011 和 012 两个文件都出现了 28,6
人工智能生成错误内容时的责任归属问题
人工智能生成错误内容时的责任归属问题一、生成式人工智能的现状与技术短板根据中国互联网信息中心发布的《生成式人工智能应用发展报告(2025)》披露,截至2025年6月,我国生成式人工智能用户规模已达5.15亿人,较2024年12月新增2.66亿人,普及率攀升至36.5%,意味着每三位网民中就有一位使用生成式人工智能服务。该数据有力证明,生成式人工智能已广泛渗透至社会生产生活的各个层面。虽然生成式人工智能技术进步显著,但其固有的技术缺陷不容忽视。其中,"AI幻觉"是最为显著的技术隐患之一。依据
AI智能体测试方法
探究AI智能体(AI Agent)与传统确定性软件测试的本质差异。传统测试关注“输入A,必然输出B”;而AI智能体具备自主规划、工具调用、长期记忆和非确定性生成能力,这使其测试维度更广、复杂度更高。构建一个成熟的AI智能体测试体系,需从核心能力评测、工程链路监控及安全护栏测试三个维度入手。对Agent的测试,通常需将其拆解为底层组件与综合表现的双重评估:目标拆解测试:向Agent下达复杂指令(如“分析过去三个月销售数据并生成PPT”),检验其能否将大任务拆解为合理的子步骤。反思与纠错:当工具调用出错(如A
安永撤下AI幻觉研究报告
该研究曾被EY加拿大的咨询团队用于宣传其网络安全业务。然而,在线研究人员发现,报告中使用了虚构数据、错误归属的引用,并提及一份并不存在的麦肯锡报告。报告标题为《攻击点:揭露忠诚度系统中的网络威胁和欺诈》(《Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems》)。在研究小组GPTZero于周四晚间发现问题后,EY加拿大已将该报告从官方网站移除。并“正在审查导致该文章发布的情况”,并补充称该研究与任何客户工作无关。安永
对话Kim张予彤:AI浪潮下的人才跃迁
5月12日晚间,我同Kimi总裁张予彤在北京大学光华管理学院展开了一场围绕“AI时代的边界探索与人才机遇”的深度对话。当前,AI技术正以不可阻挡之势深入各行各业,从日常办公的智能辅助到产业深度的变革,从基础服务的效能跃升到前沿创新的突破,技术迭代速度远超预期。与此同时,AI应用边界模糊、伦理争议、数据安全等议题日益凸显,人才市场也面临着“AI替代”与“新型人才缺口”并存的矛盾,这正是作为商科教育者的我们主动邀请张予彤总裁进行此次深入交流的初衷。在正式对话前,我与予彤总进行了小范围沟通。除简单寒暄(意外发现
AI 时代核心底气:打造你的专属智能导师
身处 AI 浪潮,个体直面市场并独立交付成果的本领,显得尤为关键。往昔在职场中,你仅是庞大体系里的一个环节。上司指派任务,你只需完成局部。你无需通晓全局,也不必样样精通。可当你真正独自迎战市场——运营账号、对接客户、打磨产品、钻研 AI、把控流量、构建单人企业……你会猛然发觉:过往那套本领,早已捉襟见肘。毕竟从"构思"迈向"实际交付",中间缺失的环节实在太多。不会的得学,不懂的需查,没做过的得硬着头皮去闯。这让许多成年人首次深刻体悟:自己时刻都在踏入未知领域。而 AI 时代
顶会论文遭AI幻觉反噬:虚假引用成隐忧
2026年1月,一篇提交至ACL 2026的论文在学术界引发轩然大波。该研究并未提出新算法,也未刷新SOTA记录。它完成了一项极具冲击力的任务:对过去两年ACL系列会议(ACL/NAACL/EMNLP)的1.7万余篇论文展开学术审查,揭露了近300篇存在虚假引用的文章。更具讽刺意味的是,刚刚落幕的EMNLP 2025正是此类幻觉引用的高发区。主会每40篇论文中就有1篇中招,比例高达2.6%。由AI生成的幻觉引用,已开始对顶级会议论文形成反噬。所谓幻觉引用(HalluCitation),并非普通引用错误,而
AI的"幻觉"现象解析
欢迎继续阅读三火的AI学习笔记。上期我们介绍了AI的基础知识,本期我们探讨一个更有趣的话题。 你是否遇到过这种情况:向AI提问时,它回答得非常自信,但仔细检查后发现内容纯属虚构。 先别急着指责它撒谎。今天我们来深入探讨,AI为何会"胡言乱语"。 ## 一、那个考试时瞎猜答案的同学 想象一下,班上有个同学叫小智。 小智博览群书,但有个特点——遇到不会的题目从不空着,一定要填满。 比如老师问:"《红楼梦》中林黛玉葬花用的是什么器具?" 小智其实不确定,但他想葬花应该需要容器。于
AI虽强,为何还需羽戎志愿系统?
如今豆包、DeepSeek、ChatGPT等大模型无所不能,为何还要付费使用志愿填报系统?这个问题问得非常到位。当然可以。你试着问:“山西考生530分能上哪所大学?”大模型通常会回复:“参考往届成绩,530分可报考山西大学、太原理工大学……”听起来似乎很完美,也很直观。但许多家长并不知情:大模型很可能会害了你。家长向AI询问:“山西理科考生530分,能被太原理工大学计算机专业录取吗?”AI回答:“依据过往数据,太原理工大学计算机专业录取线在520-530分之间,530分希望很大。”家长对此十分放心,将太原
AI助手"秒怂"引热议:豆包被指过度迎合用户,专业人士揭示背后原因
文 | 《BUG》栏目 张俊 “表面一本正经实则胡言乱语,态度诚恳却总是立即认错。” 近期,豆包在回答准确性方面的表现引发广泛讨论。#豆包 机票退款#、#豆包 秒道歉#等话题接连登上热搜,众多网友吐槽豆包在诸多问题上的回复缺乏可靠性,一旦遭到用户质疑便会立刻认错,被网友调侃为"讨好型AI"。 《BUG》栏目实际测试了让豆包列举论文参考文献,发现部分内容确实为虚构。例如在询问年份、日期等基础信息时,一旦用户提出异议,豆包就会立即改变说法,而非坚持事实。 豆包客服就此回应称,豆包的回复由模型自动生成,当前模型