标签

AI的局限:假消息与数据失真

发布时间:2026-05-25 02:08来源:微信阅读:5

AI从何时开始普及已难以追溯,但2025年春节Deepseek的惊艳亮相和2026年2月"小龙虾"的全球热潮后,个人和企业纷纷拥抱这项技术,各类培训机构也趁机推出课程获利。

听闻小米等互联网公司全面推行Agent应用,我担心被时代抛下,也投入大量时间资金学习AI。主要途径包括向软件企业学习、参观大企业了解前沿产品,以及亲自使用AI处理资料下载和数据分析。

两年使用经验表明,主流大模型在对话和知识普及上已相当智能,但生成内容仅作参考,不能用于论文或正式场合,必须人工核实。由于网络上存在大量误导性内容,AI容易将其作为答案引用。

曾读到一篇文章讲述产品营销案例被AI引用推荐,还有人尝试上传虚假论文获得AI认可。2024年有位医学研究员进行了实验,故意捏造了一种不存在的眼周疾病Bixonimania(蓝光狂躁症),以论文形式发布在预印本平台。论文漏洞百出——作者照片由AI生成,工作单位和地名全属虚构,致谢部分感谢了"企业号星舰上的实验室"和"护戒同盟大学",正文甚至明确写着"整篇论文都是虚构的"。

几周内,多款主流AI系统陆续"证实"了这一疾病的存在。微软Copilot声称"Bixonimania确实是一种迷人且相对罕见的疾病";谷歌Gemini建议有相关症状者就医眼科;Perplexity甚至给出了患病率等具体数据。AI多么容易被欺骗。这种对信息不加甄别的工具正被数亿用户当作医疗顾问。许多人用AI回复质疑医生诊断。一旦出现问题,AI只会道歉推责,患者若盲目相信AI方案,轻则治疗无效,重则延误病情。

另有一则报道,消费者通过AI订餐,到店后服务员表示没有豆包订餐通道,还说"通过豆包订的找豆包去"。消费者愤而在网上曝光该餐厅,引发热议。

近两个月想用AI分析基金底层资产,还不熟悉小龙虾,只能用元宝和豆包。3月21日从基金E账户录屏基金资产传给AI,但两者都表示无法处理视频。改用文档分析,上传给元宝处理103条基金持仓记录时,元宝竟然宕机了。

同时发给豆包文档和需求,起初它没领会意图,只按表格分类统计数据。要求它访问天天基金网或晨星网获取前十大持仓后合并统计占比,豆包声称这些网站有反爬虫机制无法访问,还一本正经地指导我如何在网站上自行查询。

豆包随后解释为何无法直接帮我查询,详细说明各种技术限制。我不接受这个解释,坚持要求它访问官网。最终勉强给出一些前十大持仓股,但核对后发现存在错误。多次追问后部分信息仍无法查到。第一次用AI查询基金底层资产的尝试就这样不愉快地收场了。

为了更好地利用AI提升效率,2026年5月24日再次花两小时让AI查询基金持仓。同样从基金E账户导出持仓数据发给元宝和豆包,为增加对比还下载了千问。今天暂时不用Deepseek,下周再测试。

从结果看,豆包进步最明显,先完成基金分类,再按需求生成持仓表格和行业分布。但在生成每只基金前十大持仓明细时表格始终无法正常显示,导致失败。由于缺少明细数据,难以验证汇总结果的准确性。

元宝进步有限,起初完全忽视上传的真实数据自行编造;指出问题后虽根据我的持仓生成前十大股票,但全部错误,比例普遍为99.99%或100.1%,完全不可用。今天使用豆包时也多次出现宕机,不知是否要求过于复杂。

千问的搜索结果与元宝类似,前十大持仓同样是编造的。今天借助AI提效的尝试以失败告终。下周再测试豆包看是否有进步,同时付费学习小龙虾的使用,期待它能提供准确的结果。

列举这些使用中的问题并非否定AI的价值。实际上AI在预测分析、图文处理、对话交互、娱乐休闲等方面都有巨大应用潜力。在要求严谨或复杂的情境中容易产生幻觉或生成无用内容只是发展中的阶段性问题,相信AI会不断改进,真正为人类提效增色。