抹香鲸是地球上声音最大的活体动物之一。 它们发出吱吱声、砰砰声和咔嗒声,与几米或数百公里外的其他鲸类动物进行交流。
这种抹香鲸声音的交响乐非常复杂,足以成为一种成熟的语言。 但是人类会理解这些鲸鱼在说什么吗?
答案是:也许
在破译鲸鱼的语言之前,研究人员必须收集和分析抹香鲸之间空前数量的交流,这几乎是肯定的。
大脑比我们的大六倍,抹香鲸(大头Phys)是具有复杂社会结构的鲸鱼,它们花费大量时间进行社交和交换信息。消息序列可以很短(例如 10 秒),也可以持续半个小时以上。事实上,与其他非人类动物相比,“鲸鱼发声的复杂性和持续时间表明,它们至少在理论上能够表现出复杂的语法”。
这是我们在 2021 年 XNUMX 月发表的一篇关于鲸鱼的论文中读到的内容 arXiv.org。
这项研究说明了什么?
这份文件来自一个跨学科项目,称为 CETI(鲸类翻译倡议),概述了解码抹香鲸发声的计划,首先收集这些鲸鱼的录音,然后使用机器学习尝试解码它们用于交流的序列。 CETI 选择研究抹香鲸而不是其他鲸鱼,因为它们的点击声具有类似摩尔斯电码的结构,人工智能 (AI) 可以更轻松地分析这种结构。
破冰
我们对抹香鲸知之甚少,这是我们最近才了解到的。直到 50 世纪 20 年代,我们才注意到这些鲸鱼发出声音。二十年来我们一直不明白他们是用这些声音来交流的。
然而,有双重目的。 抹香鲸可以潜入深海 4.000 英尺(1.200 米)。 您 三倍深 核潜艇。 那里漆黑一片:因此,这些鲸鱼已经进化为使用这些声音来寻找鱿鱼和其他食物,就像声纳一样定位自己。 根据 CETI 文件,这种相同类型的声音也用于他们的社交发声,尽管在这种情况下,交流的咔嗒声更密集。
理解这一点也很困难
长期以来,抹香鲸对人类来说非常难以研究。 由于人工智能、机器人技术和无人机,我们现在拥有能够比以往任何时候都更深入地观察的工具。
大卫·格鲁伯,海洋生物学家和 CETI 项目的负责人。
普拉秋莎·夏尔马CETI 的数据科学研究人员、MIT 计算机科学与人工智能实验室的博士生,对人工智能和语言模型的最新发展非常有信心,例如 GPT-3,它使用深度学习来构建人类文本或故事。 科学家们希望这些相同的方法可以应用于抹香鲸的发声来构建它们的语言。 只有一个问题:这些方法对数据有着巨大的胃口。
我们有100.000个注册,但我们需要4亿!
CETI项目目前拥有大约100.000万次鲸鱼点击的记录,这些记录是海洋生物学家多年来精心收集的,但机器学习算法可能需要其中大约4亿次点击。为了填补这一空白,CETI 正在创建多个自动渠道来收集抹香鲸记录。方法包括将水下麦克风放置在鲸鱼经常出没的水域中,以及可以从飞行的无人机上投下的麦克风。甚至机器鱼也可以跟随鲸鱼并聆听鲸鱼的声音而不被注意到。
但即使有了所有这些数据,我们能解密吗?
许多机器学习算法发现音频比文本更难分析。例如,可能很难分析单词的开头和结尾。正如夏尔马解释的那样,“假设有‘雨伞’这个词。是“唵”这个词吗?或者它“很好”吗?还是一把‘雨伞’?”口语单词之间的障碍更加模糊且不那么规律,因此可能需要更多的数据来发现模式。
这并不是CETI面临的唯一困难。
“无论某人来自日本、美国还是其他任何地方,我们谈论的世界都非常相似;我们谈论人,我们谈论他们的行为,”夏尔马说。 “但是这些鲸鱼生活的世界非常不同,对吗?而且行为方式也非常不同。”
此外,来自 6 年发表在该杂志上的一项为期 2016 年的研究 英国皇家学会开放科学,众所周知,抹香鲸甚至有方言。
如果这看起来是个巨大的困难,那就考虑去月球吧。 这些困难正是使该项目如此雄心勃勃和值得的原因。 今天,一条鲸鱼对另一条鲸鱼说的话就像它们游泳的水域一样黑暗,但它是一个谜,使 CETI 非常、非常有趣。