标签

AI 识图有局限:老字谜难倒智能助手

发布时间:2026-07-04 12:53阅读:2

曾写过一篇文章探讨 AI 的边界。当时引用了 AI 的自述,但由于许多概念对老年人来说较为生疏,不容易理解。恰好最近在使用 AI 时,发现它“露怯”了,通过具体事例来说明,问题就清晰多了。

这是一个图像识别问题。偶然翻到几年前的智力测试:找出藏字图中的汉字。于是,点击“+”将图片输入到小艺对话中,问道:这个线条图由几个字组成。

生成总结:图片中没有文字,因此无法统计字数。(见截图)

显然这是触碰到 AI 的边界。起初感到惊讶,识图、选词、翻译本是小艺的强项,为何会出现这种纰漏?经过一番思考,自我解答:当初扫描仪辨别文字,主要针对印刷体,字迹不清时也常出错;手机 AI 对不工整潦草的手写字词识别能力较差,因此无法识别藏字画中的汉字也是情理之中。

接着进行同样操作,将这幅藏字画分别输入手机中另外两款 AI 应用:“豆包”和“元宝”,它们的回答十分有趣。先来简要介绍,若想获取详情,可操作自己的手机询问相应 AI,欢迎在留言区交流分享。

打开“豆包”对话,点击“+”输入藏字图,问道:这个图是由几个汉字组成的?

“豆包”搜索 1 个关键词,参考六篇资料>(语音回答)

这幅长寿寿星白描图,画面线条融合构成 10 个汉字,连起来是一句吉祥祝语:身体健康长命百岁。

拆分对应(以上回答文字可见截图)

身(拐杖、衣袖线条)

体(胡须、面部纹路)

健(寿桃轮廓)

康(衣袍褶皱)

长(额头皱纹、头顶)

命(手部、桃叶)

百(胡须纹理)

岁(下摆、拐杖底部)

完整十个字:身体健康长命百岁。

若不细看,这个解答似乎可以打 100 分,但若将十个字与图中位置一一比对,会发现完全对不上。

身(拐杖、衣袖线条)——分明是“老”、“康”和“福”

体(胡须、面部纹路)——分明是“寿”、“祝”

另外,“朋”、“友”这两个字最为明显,显然“豆包”也露怯了。这并非识图分辨汉字,可能是在对照先前存入的藏字图寻找答案,这正是 AI 的“技术边界”(AI 高度依赖训练数据,难以处理未见过的全新场景;物理交互能力有限,在复杂环境下的可靠性不如人类。——“小爱同学”解答)

继续同样操作,询问“元宝”

这是一幅中国传统神话人物南极仙翁(寿星)的简笔画/线稿。同时,该形象也是近期热门动画电影《哪吒之魔童闹海》中反派角色“无量仙翁”的原型与核心设计参考。

画面特征解析:

高额(寿星头):图中人物最显著的特征是硕大且隆起的额头,这在传统民俗中象征着长寿(仿丹顶鹤头部之形),俗称“寿星头”。

手持拐杖:右手拄着一根顶端有装饰的弯曲长杖(通常为龙头拐杖或鸠杖),这是寿星的标志性法器。

手托仙桃:左手抱着一颗硕大的仙桃,桃尖有叶子点缀。仙桃是西王母蟠桃会上的长寿仙果,象征长生不老。

面容慈祥:长须飘飘,眯眼微笑,呈现出一副仙风道骨、喜气洋洋的老神仙模样。

角色背景延伸:

传统神话(南极仙翁):……(故事较长,以下略)

听完了“元宝”讲述的南极仙翁故事后,提醒道:“这也是一幅藏字画,画中藏有哪些汉字?”

“元宝”给出的答案是四个字:“长命百岁”,并指出汉字分别对应的图上位置。

这幅寿星简笔画是一幅经典的“组字画”(或称“字画交融”),它巧妙地将一句吉祥祝福语融入了人物的轮廓线条中。画中主要隐藏了以下四个汉字:

1. “长”

隐藏位置:寿星的头部。

解析:寿星那高耸、向后弯曲的额头轮廓,加上两侧下垂的线条,构成了一个草书或行书的“长”字。

2. “命”

隐藏位置:寿星的右侧(画面左侧)。

解析:寿星的耳朵轮廓、部分头发线条以及脸颊边缘,组合在一起形似一个“命”字。

3. “百”

隐藏位置:寿星的嘴部与下巴。

解析:寿星笑眯眯的嘴巴轮廓,加上下方蓬松的长胡须,整体形状构成了一个“百”字。

4. “岁”

隐藏位置:寿星的左侧脸颊与身体边缘(画面右侧)。

解析:寿星的另一侧脸颊线条、衣领以及手持拐杖的部分轮廓,共同勾勒出了一个“岁”字。

总结:……

若对照图中位置找字,同样令人失望。这是否也遇到了同样的 AI 边界?

将这幅藏字图转发到老同学微信群,很快被辨认出十个汉字,一句祝福语:祝福老年朋友健康长寿

附录:与“豆包”交流藏字图详尽对话(也可以自行操作,不妨试试让手机 AI 识别其它藏字画)

接前面“豆包”列出:

询问豆包:是否辨认有误?有些字很明显如:老朋友、长寿、

“豆包”解答:

一、先说标准答案