标签

AI易生幻觉,百度筑防线

发布时间:2026-04-25 02:20来源:微信阅读:11

人类一动脑,上天就发笑。《思考快与慢》的作者卡尼曼曾举过一个典型案例。心理学家研究股票市场时发现了一个怪象:若某家公司股票代码朗朗上口,其上市初期的市值表现,往往会碾压那些字母组合拗口的同行。

一位衣冠楚楚的华尔街操盘手,每日在交易屏前掠过成百上千个股票代码时,一个简洁明了的代码会让大脑产生流畅体验,偏差随之产生:"嗯,这家企业看起来挺靠谱,值得投资。"对此,卡尼曼提出了一个概念:认知流畅。人类大脑在处理信息时,一贯遵循阻力最小定律,当信息呈现得顺滑自然,人们极易忽略潜在的逻辑漏洞与事实缺位。这与人类的思维模式紧密相关。按卡尼曼的划分,人类拥有两套思维系统:系统一,是直觉主导的快速思考;系统二,是逻辑主导的缓慢思考。

从早到晚,大脑每天要做出逾三万个决策:细到早餐选什么,大到投资做什么,我们不可能事事都深思熟虑、周全考虑。因此,绝大多数情况下,系统一的快思维才是主角,看到红灯刹那便知道停行,看到2+2就能脱口而出答案。然而,系统一并非无懈可击,它极易被"错觉"干扰:当一段文字通顺、逻辑闭环、排版精致的信息出现时,大脑往往会默认其真实性。卡尼曼指出,这正是人类认知中常见的谬误:"眼见即为实。"

一、AI如何加剧我们的思维缺陷?

在AI试图解答万物的当下,人类思维模式的短板正被急剧放大。过去几年,国内AI厂商纷纷"内卷"模型规模、"攀比"对话流畅度,却忽略了信源可靠性。归根结底,模型的底层逻辑就是个接收装置,喂什么语料,就吐什么内容。一旦训练数据存在冲突、瑕疵或信息缺口,AI就可能煞有介事地信口开河,产生幻觉。

对话中,某些AI给出的答复毫无语病、衔接自然,还带点安抚口吻,提供了满满的情绪价值,但有时候却在不懂装懂,杜撰细节、生成与事实背离的答案,持续冲击我们的思维盲区。此时,人们的认知偏差愈发严重,引发的误会也更加离奇。早前,演员刘美含用AI查询"铸币坊"的读音,结果登上了热搜。她接连测试了五款主流AI工具,却越查越困惑。最终,唯有百度AI给出了《新华词典》与语言学家共同认证的正确读音:"fáng"。

2026年,用户想靠AI识个字音居然困难重重,这是科技巨头技术储备不够吗?未必,但大众对AI"信口雌黄"的现象,已积聚了强烈不满。不仅如此,此前"3·15"晚会曾揭露了GEO业务如何"打擦边球":某些不法商家通过批量炮制虚假测评,伪造权威推荐内容,转而投喂给大模型,让AI输出定制推荐,一条条灰色产业链就此形成。此时,精准真实的信息成了稀缺资源,本应更快消除信息孤岛的科技普惠红利,却被反手变现为一门生意。人们不禁要问:AI普惠的红利,究竟流向何方?

桥水基金创始人达利欧在《原则》中将信息真实提升到系统论层面,提出了"极致求真"理念。他写道:"真相——或更确切地说,对现实的精准把握——是一切良好结果的根本前提。"达利欧认为,真相是人类社会演进的基础,一旦信息遭到扭曲,决策体系便会瘫痪。

事实上,即便生成式AI能够直接、迅捷地提供结果,但若以牺牲真实准确为代价,AI失灵的困境将持续上演。知名科普平台果壳网近期对8款主流AI产品进行了横向测评,结果表明,AI回答的质量取决于采用何种信源。譬如,在医疗、航天、时政等复杂问答场景中,一旦AI援引百科内容,就能获得更精准、更完整、更具时效性的答复。这再次证明,求真并非口号,必须扎扎实实落到实处,让搜索获取可靠的基础数据,让AI获得准确的信源,才是赢得用户信赖的长久之计。

果壳网此次实验数据显示,接入百度百科的参考信源后,受测AI的综合准确率平均提升了38%以上,关键事实偏差率从26.4%猛降至4.1%以内,答案获得了超过九成专家的认可。此时的AI才从一本正经的胡说八道,蜕变为足以媲美资深行家的智多星。二、信息可靠,只是基础

AI时代,技术走向固然值得探讨,但回归初心、追求真实以赢得用户信赖更为关键。值得庆幸的是,这种趋势正被越来越多企业所认知。"每一条百度AI答案背后,都历经了三道'权威性'筛汰。"在今天的百度创作者大会上,百度集团副总裁、百度APP产运中心负责人李小婉表示,AI赋予用户强大能力的同时,信息不安全感依然存在。为此,百度搜索近期再度升级,聚焦信息真实与安全推出了一整套组合拳。

首先,百度搜索在原有架构上新设了双Agent系统,一个是需求规划Agent,一个是组织生成Agent。前者将用户潜在需求细致拆解,后者可对不同信源进行筛选、核验与提炼,双Agent协作最终输出一站式完整解答——过去,用户在百度搜索旅行方案,需逐一比对众多链接,如今仅需一次提问,百度搜索就能通过深度交互生成涵盖交通住宿、景点美食的完整攻略。

"我们不仅看内容,更看'血统'。唯有那些源自权威专业领域、时效性强的信息源,才有资格入围候选池。"李小婉表示,依托严苛的信源准入管控、交叉核验机制,叠加自动巡检系统,三道权威筛汰层层把关,百度始终珍视自身内容的确定性与安全性。尤其在内容信源上,百度自家产品百科实力强劲。仅从规模与收录范围来看,百度百科堪称全球权威知识库,目前词条总量已超3000万,覆盖英、法、日、俄、西五种语言,再加上超810万用户持续"赋能",每秒即可诞生一个新版本词条,热点内容更能实现分钟级迭代。

这也让百度百科的内容弹药库,兼具广度、深度与实时响应的敏捷度。可这仍显不足。当下,百度百科对内容准入实施了严苛的把关机制,所有词条必须有权威参考资料支撑,UGC内容必须历经机审+人审双重检验,方可入库。此外,再加上汇聚超十万行业专家,共建超百万专业词条,以及众多顶尖机构专家严格审定后,百度搜索的内容池,正从信源准入、交叉核验,全力向权威、专业、务实靠拢。当然,这并不意味着百度搜索提供的答案就完美无缺,但其底层系统配置了秒级巡检与纠错机制,过程中一旦发现答案瑕疵,便会迅速介入人工,予以修正。

AI时代,用户与平台之间亟待建立的信任纽带,百度正尝试交出自身答卷。三、AI时代,满足好奇的进阶形态

可靠是根基,懂用户所想、供用户所需的AI搜索才是未来方向。此次百度在创作者大会上介绍,除满足用户基础问答需求外,百度搜索还在持续探索,以更易懂、更精准、更便捷的方式,实现用户任务交付。

譬如,近期百度在搜索结果页上线了交互式组件,用户可直接动手体验。天文爱好者既可拖拽太阳系模型,观测行星间的真实间距,也可点开黄河图标,探索这条母亲河流经的城市。此外,百度App还以"搜索+文心"双引擎驱动,一体两面,共同构成了百度App内完整的用户需求满足闭环:在百度搜索快速、精准地为用户解决客观问题后,文心助手随即登场,可协助用户处理更为复杂、深层的需求,在多轮互动中,持续挖掘用户潜在意图。

比方说,用户若计划出行旅游,文心助手可一步步协助用户明确需求、理清思路,相当于配备了一位贴心的本地向导,可结合用户的行程时间、预算、节奏、住宿偏好等要求,提供因地制宜、因时制宜的个性化方案。事实上,由繁入简、由冷转热、再由虚向实,百度一个问答模式的变迁背后,暗含互联网搜索趋势的演进。从传统搜索、到推荐算法、再到AI智能体时代,搜索逻辑层层递进,侧重点持续迁移。但若要探寻一个核心,或许仍是提升人们获取知识与信息的效率,由此彻底释放并满足人类的好奇心。

这对10后这批AI原住民而言,亦有独特意义:当AI搜索以真实信息为后盾,辅以更快、更高效的知识传递,那么更多新生代将在兴趣驱动下,彻底解放求知欲与创造力。此次百度创作者大会上,11岁的少年庄铭杨用百度APP现场演示了如何玩转月球模型——过去数月,他通过日益形象直观的百度搜索,自学了课本上原本抽象晦涩的天文学知识,自己也成为了百度创作者中的小小明星:"我很开心,如今的AI技术能让我更轻松地看懂这些科学知识,感觉学习就像游戏一样。"这或许也揭示了科技发展的另一层价值:让人类持续拓展通向未来的好奇心与可能性。