在所有提出的人类语言特性中,唯一没有在动物交流系统中得到最终记录的特性是递归结构。甚至在这里,关于某些鸣禽是否使用递归语法将具有不同含义的呼叫组合在一起,也存在持续的争论。
那么,动物交流系统与人类语言有许多相似之处,是否有资格成为成熟的语言?
动物语言?
包括 Slobodchikoff 在内的一些科学家将动物交流称为“动物语言”,正是因为就像人类使用语言进行交流一样,动物的语言和手势信号也是动物交流的方式。如果人类语言是从我们远古祖先的交流系统进化而来的,那么动物交流不应该也有资格作为语言吗?如果我们系统地将人类语言与动物交流区分开来,我们就有可能在我们崇高的人类和我们所属的自然世界之间设置障碍。毕竟,动物的交流系统在它们的环境中为它们服务,就像人类语言在我们的环境中为我们服务一样。仅仅因为动物可能不像我们那样交流,就将它们从语言中驱逐出去似乎是非常不公平的。
但动物和人类使用的显然不是相同的交流系统。道路标志使用非任意符号传达信息,这些符号指示着环境的各个方面,但很少可以以任何可理解的方式组合。动物也会在不诉诸语言的情况下标记领土和路径。人类和动物都使用外貌来表示年龄、性别和社会地位。但我们的时尚宣言并不遵循自然语言的语法规则。
我们可以和动物说话吗?

抹香鲸拥有所有动物中最大的大脑,它们使用称为尾声的短促点击进行交流
虽然目前没有压倒性的证据表明任何动物交流系统表现出人类语言的所有特征,但这并不能保证我们可能还没有发现一个可以做到的!这就是为什么我们对目前使用人工智能和机器学习技术来分析和破译地球上一些最聪明、大脑最大的非人类物种——鲸鱼的声音的项目如此兴奋的原因。
由伦敦帝国理工学院的 Michael Bronstein 领导的 CETI 项目正在分析抹香鲸用于长距离通信的点击序列,而另一个由野生海豚项目研究主任 Denise Herzing 和佐治亚理工学院的 Thad Stamer 领导的小组正在分析海豚发出的声音。这两个小组使用的技术直接来自现代自然语言处理。具体来说,他们使用深度神经网络来构建动物发声的语言模型。
语言模型是一个计算系统,给定序列的前几项,预测接下来会发生什么。在过去的几年里,预算充足的科技公司已经训练了巨大的神经网络来预测英语(或其他自然语言)句子的下一个单词。而 10 年前,最好的语言模型甚至无法生成一个连贯的句子;现在,像 GPT-3 这样的深度语言模型可以生成大部分连在一起的整个段落。
要将深度语言模型应用于鲸鱼发声,必须克服许多挑战:如何找到鲸鱼对应的单词?如何扩大记录的鲸鱼发声数量?当前成功的深度学习算法所训练的数据比我们目前拥有的抹香鲸记录数量多几个数量级。
但也许最大的挑战是,即使我们能够建立一个基于鲸鱼发声的语言模型,该模型可能会产生这样的输出,虽然对于抹香鲸来说听起来自然和正确,但对我们人类来说只是另一个难以理解的点击序列!
Emily Bender 和 Alexander Koller 最近的一篇论文认为,像 GPT-3 这样仅在文本上进行训练的现代语言模型本质上无法将它们产生的单词与现实世界中的对象和实体联系起来。这些模型既不“理解”输入文本,也不“理解”输出文本。它们只是产生人类能够解释的点击序列!
为了解决这个问题,将录音与有关环境的上下文信息联系起来至关重要。例如,在土拨鼠的实验中,Con Slobodchikoff 仔细记录了每只土拨鼠发出警报时正在靠近的捕食者。
相信大家都非常希望能够克服这些挑战。我们发现鲸鱼确实用成熟的语言进行交流。已经清楚地操纵和利用其环境的鲸鱼通过以复杂(甚至递归)方式组合任意符号来传达意义。希望我们不仅能发现对鲸鱼发声的正确反应,还能用人类理解的语言解释这种发声。
期待我们与鲸鱼进行有意义对话的那一天 —— 那将是一个历史性的时刻!