AI也会失误
你会相信AI也会出错吗?如今AI早已融入日常,从智能问答、文案创作到图像识别、数据处理等领域,几乎处处都能看见它的身影。但别因为它“很强”就觉得它永远不会出问题,实际上它同样会出现错误。我用的是豆包,最近就遇到了它的失误。我问的是联合国安理会轮值主席的任期和职责,豆包的回复如下图所示:我注意到其中有问题,比如“一年轮换15次”这句话不太对,于是继续追问。如下图:豆包的认错态度仍然很诚恳。既然是号称万能的AI,怎么还会犯这种错误?原因在于,AI的学习依靠海量数据,若数据本身存在缺口,或算法仍不够完善,就更容
数据标注的“阴影”:AI模型“学坏”的根源
> 2024年,麻省理工学院(MIT)的一项引起学术界广泛关注的研究揭示,包括ImageNet在内的十个主流人工智能基准数据集,其平均标注错误率高达3.3%。其中,ImageNet验证集竟有2,916张图片被错误标记——这意味着全球无数AI模型在过去的数年间,都是基于这些“错误答案”进行训练的。数据标注,这一常常被忽视的AI基础环节,正悄然成为影响模型成败的关键“隐形战场”。在深度学习飞速发展的今天,AI模型本质上是一个“模仿学习者”:如果我们向其展示一百万张被标记为“猫”的图片,它便能学会识别猫。
AI提问避坑:拒绝瞎编套路与过时信息,让回答更可靠
现在几乎人人都会用AI:查资料、写文案、做攻略、解难题、写作业……效率确实提升了,可很多人都在反复掉进同一个局:把AI的每一句话都当真。你看到的回答往往看起来很顺、很“专业”,但实际可能是数据乱编、内容陈旧、满篇套话,甚至关键结论完全不对。踩一次可能只是返工改稿、闹个笑话;要是用于决策,就可能造成失误,甚至带来经济损失。多数情况下,AI并不是真有你想的那么稳定。真正让输出变得不靠谱的,往往不是模型本身不行,而是提问方式走偏。下面这份给普通人的AI提问避坑清单,简单直接、都是干货,读完就能立刻用,也更适合长
我开始有点离不开AI了
不经意间发现自己处理问题的思考能力好像退步了不少,脑子也变得懒了。每次碰到作业或者遇到不懂的题,就直接去问豆包,或者用DeepSeek;仿佛不借助AI帮我把思路梳理出来,我自己就不知道该从哪里开始,也不会做了。当然也不是说AI不好,技术进步确实让我们能接触到海量的信息,但我的筛选和判断能力还没跟上,于是它怎么说我就怎么信。可其实AI整理出来的内容也可能出错,不能不加分辨就全盘接受。人的语言真的很美,这些是AI很难真正仿出来的;人写下的真情实感往往比AI更有温度、更有智慧,也更容易触动人心。
AI Agent的行为幻觉:智能体从语言失误到实际损害的演进
本文分析 AI Agent 技术从单纯生成内容( LLM )向能够执行外部动作( Agent )转变过程中,幻觉问题的本质变化——即从“言语层面的错误”升级为“可能引发真实损失的行为错误”。结合典型案例剖析其生成机理,并探讨当前行业主流的缓解方案。大型语言模型( LLM )的幻觉( Hallucination )早已广为人知:模型在生成文本时,可能输出与客观事实相悖或完全虚构的信息。然而,当 LLM 被赋予调用外部工具、执行代码或与环境交互的能力,形成 AI Agent 时,幻觉的影响将不再局限于信息层面
解密AI写作中的幻觉现象
AI技术在学术论文撰写中的应用已成为一个崭新且备受瞩目的趋势。除了常见的ChatGPT、DeepSeek、豆包、千问等工具,一些高级的AI写作助手甚至能够直接产出毕业论文、期刊文章、文献综述、开题报告、答辩演示文稿以及实践报告等多种形式的学术内容。接触过AI辅助写作的同学或许有所耳闻,使用AI生成的文本需要警惕所谓的“AI幻觉”。那么,究竟什么是AI幻觉呢?AI幻觉指的是像ChatGPT、DeepSeek、豆包、千问这类人工智能工具,所生成的内容表面上看起来流畅且合乎逻辑,实则包含虚假或错误的信息。具体到
人工智能不可盲目信赖
当下AI技术可谓炙手可热,许多人遇到问题总爱向豆包请教。今早刷到个视频令人哭笑不得:有位网友手持彩色蘑菇询问豆包能否食用,豆包信誓旦旦称无毒可放心吃,结果那人不幸中毒身亡;豆包赶紧道歉,说抱歉刚才判断失误,这蘑菇剧毒无比,千万别碰。某晚八点多我赶去学校接孩子,途中与豆包闲聊,它说五点半就能接到孩子了吧。我反问它看看现在几点,它赶紧道歉说不好意思,刚才时间看错了。目前AI技术尚不成熟,许多信息都是从网络上抓取而来,难免会出现错误,因此我们绝不能盲目相信AI。
AI论文解读:大型语言模型中的“谄媚”与论证图挑战
未来打算分享几篇AI领域的学术文章,既是为了给自己做个网络存档,也希望能给从事智能传播研究的朋友带来一些灵感~摘要:AI系统中的“谄媚”现象,特别是在大型语言模型(LLMs)里,对保持客观、批判性思考及平衡论证构成了巨大阻碍。所谓“谄媚”,是指AI系统倾向于迎合用户的偏见、喜好或主流观点,而不是提供理由充分、公正无偏的论据。这个问题在论证框架里尤为严重,因为AI模型本应基于逻辑一致性而非顺从性来分析、评估和生成论证。随着法律、政策分析和决策支持等领域对AI驱动论证系统的依赖增加,迫切需要建立有效机制来减少
AI时代开发者的进化:从写代码到决策
AI正在重构软件开发。但它改变的,并不是很多人以为的那一部分。写代码,确实变得越来越容易了。 甚至可以说,已经开始“廉价化”。但与此同时,一个更隐蔽的变化正在发生:开发的难点,正在从“实现”,转向“决策”。我最近观察到一个很明显的现象:他们用的是同样的工具,甚至是同样的模型。差距在哪?不是prompt。 不是工具。 甚至也不是技术能力。而是:有没有人,已经在进化成“开发超级个体”。过去,一个系统需要:现在,一个人 + AI,就可以完成。但问题是:👉 为什么有的人能做到“1个人 = 一个团队”? 👉 有的人
光大银行财报“乌龙门”:数据错位、业绩双降
登录新浪财经APP 搜索【信披】查看更多考评等级 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:独角金融 作者 | 刘银平、谢美浴编辑 | 付影 3月末,资本市场迎来年报披露的密集期,光大银行(3.190, -0.01, -0.31%)的年报引起市场关注,关注点并非在业绩上面,而是因为一份年报,两个版本,40家分行数据“打架”。 仔细校对之后发现,原来是A股、H股年报中的分行资产规模数据出现错位情况,尽管光大银行紧急修复并发布了正确的版本,但这种“低级错误”着实不应该发生
伊朗官员警示:美方错误导致世界'失去霍尔木兹海峡'
人民财讯3月31日报道,当地时间3月31日,伊朗伊斯兰革命卫队副司令阿里·法达维表示,美国的'错误行为'导致世界'失去了霍尔木兹海峡'。 阿里·法达维指出,美国未能正确评估形势,原本计划在三到五天内实现的目标一个也没达成。 许多国际观察人士对此表示赞同,认为霍尔木兹海峡原本畅通无阻,但由于美国的错误,如今已变得 unsafe。
飞速创新配发文件出错延至上市5日才修正,业内震惊
来源:星岛记事 内地网络解决方案服务商飞速创新,在港交所挂牌交易第5天方更正新股配发结果文件,所幸实际股份分配操作准确无误。多位投行人士指出,此类公告的最终把关责任,应由保荐人承担。香港证监会及港交所均回应称,不就个别个案发表意见。 飞速创新:执行过程未偏差 飞速创新于本月20日(周五)首次发布的配发结果公告中,存在逻辑矛盾。其一,公告显示有效申请总数为31,492份,且无人可稳中一手,即仅分配31,492手,但公开发售部分实际发售量为4万手,数据明显不符;其二,按《星岛》依公告原始数据推算,乙组(认购金
AI编程:表里不一
这现象,我觉得挺可笑的。最近常有程序员朋友抱怨,说公司里现在写代码全依赖AI。一进IDE,不先思考逻辑,而是直接把需求输入对话框,按回车,搞定。结果呢?提交的代码外表光鲜,变量命名规范,注释也像模像样,排版整齐。初看之下,哇,这代码写得,真像人写的。可一运行,bug数量超过代码行数。直说吧,这做法太离谱。AI写代码,就像考前死记硬背的差生。你给需求,它快速输出一页,字迹端正,段落分明,表面能骗人。但细看内容,全是废话,核心逻辑错误或缺失。简言之,它学习的是似代码的文本,而非可执行逻辑。它懂for循环格式,