AI技术突破：探索动物交流的新进展

发布时间：2026-04-20 18:56阅读：47

人工智能已经助力我们操控Siri和Alexa，但如果将这项技术延伸到其他生物种群会怎样？若干大型科研计划正运用机器学习来破解动物的沟通方式。尽管与猫咪进行完全“对话式”的交流仍属幻想，但初步成果已相当可观，并引发了关于语言本质的深入思考。这个话题之所以备受关注，是因为科学家们已在另一项实验中成功与鲸鱼实现了交流。

动物是否拥有语言？科研人员如何评估动物的语言能力？在“翻译”任何事物之前，我们需要先明确自己究竟在翻译什么。人类通过语言、手势和面部表情进行沟通。动物同样使用复杂的信号——犬类摇尾、蜜蜂起舞、海豚发出咔哒声和哨音，而大象事实上还能用名字相互称呼。但这真的能称为语言吗？

野生海豚项目科学主任丹尼斯·赫尔辛阐述道：我们尚不确定动物是否拥有真正的语言，但人工智能能够检测到它们交流中类似语言的结构——类似于语法或词汇的元素。若能发现这类模式，将有力证明动物的沟通系统远比我们想象的要复杂得多。

而这正是核心挑战所在。德国灵长类动物研究中心的茱莉亚·费舍尔警示说：人工智能并非万能解决方案。算法可以从声音中识别模式，但若不观察现实世界中的行为，这些模式便毫无价值。仅记录数千小时的声音远远不够——必须将它们与动物的实际行为相关联。否则，任何与动物沟通的尝试都将沦为空谈。

哥本哈根大学的动物行为学家埃洛迪·布里弗指出，动物的叫声传递着丰富的信息——从个体身份到情绪状态、当前处境，甚至是对外部事件的描述。理论上，人工智能完全可以捕捉到所有这些信息。

机器学习——一种无需严格规则即可分析数据的AI技术——扮演着关键角色。该算法处理录音并自动识别模式。这与智能手机和语音助手上的预测文本技术原理相同。不同之处在于，动物的“语言模型”并非基于词语，而是基于声音信号——咔哒声、哨音、咕噜声和超声波。

布里弗认为，机器学习的优势在于处理规模。人工分析录音需要耗费数年光阴，而算法能够处理数千小时的数据，并发现研究人员可能遗漏的模式。

该领域的核心组织之一是致力于运用人工智能解码动物交流的非营利机构“地球物种计划”。他们的方法建立在一种理念之上：语言可以被表示为几何形状——类似于星系，其中每个“词”都是一颗星球，而星球之间的距离则编码了语义关系。若两种语言的形式相匹配，它们就可以相互“叠加”，从而实现翻译。

2021年末，地球物种计划在《科学报告》发表了一篇论文，描述了一种能够解决所谓“鸡尾酒会问题”的算法。设想在一个嘈杂的派对上，多人的声音同时响起，几乎无法分辨是谁在说话。录制一群动物的声音时同样会遇到这个问题。地球物种计划的算法能够识别出群体中究竟是哪只海豚、猕猴或蝙蝠在“发声”。

目前，该计划正在开发NatureLM-audio——全球首个专门用于分析动物发声的大规模音频语言模型。它已在涵盖人类语音、音乐和环境声音等海量数据集上进行了训练。初步结果表明，从人类语音中提取的模式确实有助于提升对其他物种声音的理解。

另一个大型计划——鲸类翻译计划（CETI）——专注于抹香鲸。这些鲸鱼使用被称为“密码”的有节奏的咔哒声进行交流。科学家此前认为这些声音类似摩尔斯电码。但利用生成式神经网络（GAN）的研究揭示了一个惊人发现：抹香鲸咔哒声的声学特性与人类语音中的元音极为相似——在持续时间、频率和轨迹上都存在变化，如同人类一样。

CETI的研究人员已识别出156种不同的密码及其基本组成部分——本质上是一种“抹香鲸语音字母表”。该计划汇聚了来自八个研究所的约50名科学家，涵盖语言学、机器人学、密码学和海洋生物学等领域。

海豚研究方面也有新进展。由丹尼斯·赫尔辛创立的野生海豚项目在2013年取得了一项显著成果：研究人员训练了一群海豚，使它们能够将特定哨音与马尾藻联系起来。随后，机器学习算法能够在野外识别这种哨音。近期，谷歌与野生海豚项目和佐治亚理工学院合作，推出了DolphinGemma——一个基于Gemma架构的人工智能模型，使用长期收集的大西洋斑点海豚叫声数据库进行训练。

DolphinGemma的工作原理是“声音输入，声音输出”：该模型分析海豚的声音序列并预测后续内容，如同语言模型预测句子中的下一个词。此外，该模型足够精简（约40亿参数），可以直接在谷歌Pixel智能手机上运行——即使在水下也能进行测试。

鲸类并非唯一吸引研究人员关注的动物。埃洛迪·布里弗和她的团队训练了一个人工智能系统，能够识别猪的哼哼声、尖叫声和低吼声中所蕴含的积极和消极情绪。这并非抽象的理论研究——了解农场动物的情绪可以直接改善它们的生存条件。

啮齿动物的情况更加有趣。小鼠和大鼠使用超声波频率进行交流——它们的“对话”人耳根本无法听见。华盛顿大学的科学家开发了一款名为DeepSqueak的程序，能够将超声波信号转换成频谱图（声音的可视化呈现），并使用神经网络进行分析。研究发现，啮齿动物约有20种不同的发声方式，而且它们会根据不同情境使用不同的“歌声”——例如，雄性小鼠在另一只雄性面前的“歌声”与在雌性附近时的“歌声”截然不同。

除了显而易见的好处（终于能够了解猫咪的真实想法）之外，理解动物交流还有着非常实际的意义。对于宠物和农场动物而言，这关乎它们的福祉。

“对于与我们共同生活的物种而言，了解它们的福祉至关重要，因为它们的福祉依赖于我们，”动物行为学家埃洛迪·布里弗表示。

但潜在变化的范围远不止于此。若事实证明动物确实拥有语言能力，这可能会迫使人们重新审视它们在体育、娱乐、科学实验和农业等领域的待遇。而且这不仅仅关乎交流：越来越多的证据表明，许多物种比我们想象的更为聪明。来自“动物与地球智能技术计划”的科学家已与纽约大学的法学专家合作，研究抹香鲸交流的发现将如何影响动物的法律地位。

此外，这还具有重要的科学意义。研究动物交流能够帮助我们了解语言本身的演化历程。

丹尼斯·赫尔辛提出了一个更具远见的观点：“我们为地球物种开发的工具可能对遥远的世界有用——如果我们有朝一日遇到其他形式的生命的话。”

保持务实的态度至关重要：我们距离真正与动物“交流”仍有很长的路要走。机器学习可以帮助我们发现声音中的模式，但将这些模式转化为意义则是一项独立且更为复杂的任务，需要多年的实地观察才能完成。尽管如此，科学家们有史以来首次拥有了处理动物交流数据的工具，其规模之大前所未有。每发现一种模式，都让我们离理解与数百万其他物种共享的这个世界的复杂性和丰富性更近一步。

← 上一篇：通州人工智能智算中心项目设计方案公示,占地约1.33公顷下一篇：湖北人工智能产业规模突破1600亿元 →