加州大学圣地亚哥分校的研究人员最近建立了一个机器学习系统,可以预测鸟类将要唱歌的内容。
如果你没有找到很大的实际可能性,我首先告诉你,语音假肢的实时预测语音合成已经是一件很棒的事情。 但是理解鸟鸣的意义可能会更远。
鸟语花香,一个极其清晰的世界
鸟鸣是一种复杂的交流形式,涉及节奏、音调,最重要的是,还包括习得的行为。
研究人员表示,教人工智能理解(并能够构建足够的能力来预测)鸟鸣声是在取代人类生物发声的道路上迈出的宝贵一步。
运动假肢使用灵长类动物作为动物模型。目前还没有类似的发声假体模型。这也许就是为什么这些在神经接口技术、大脑覆盖和行为研究设计方面受到更多限制的原因。
“思考”鸟鸣并不容易,但却是重要的一步
鸣禽是复杂的习得声音行为的有趣模型。鸟鸣声与人类语言有许多独特的相似之处。研究它已经提供了有关声音运动技能学习、执行和维持的机制和回路的极好的一般信息。
但是实时翻译发声并不是一个容易的挑战。 与我们自然的思维-语言模式相比,当前的系统仍然很慢。
想想看,因为它很美:尖端的自然语言处理系统仍然难以跟上人类的思维。
我们的车还是太快了
当我们与 Google Assistant 或 Alexa 交互时,停顿时间通常比我们与真人交谈时预期的要长。这是因为人工智能正在处理我们的语音,确定每个单词与其功能相关的含义,然后确定要访问哪些反应或程序来响应。
当然,这些基于云的系统以这样的速度运行已经令人惊讶了。但它们还不足以创建一个实时界面,让无声者能够以思考的速度说话。
鸟鸣研究
首先,研究小组将电极植入十几只鸟类(斑胸草雀)的大脑中,然后开始记录鸟类唱歌时的大脑活动。
但训练人工智能识别鸟类在歌唱时的神经活动还不够:即使是鸟类的大脑也太复杂,无法完全映射其神经元之间的通信方式。
因此,研究人员训练了另一个系统,将歌曲实时简化为人工智能可以识别的模式。
它非常有趣,因为它为一个悬而未决的问题提供了解决方案。
鸟鸣声的实时处理令人印象深刻 用人类语言复制这些结果将具有历史意义。
但是第一份工作还没有准备好。 而且它还不能适应其他语音系统。 除了鸟鸣之外,它可能不起作用。
但如果实现了,那将是自 2014 年深度学习复兴以来脑机接口的首次巨大技术飞跃之一。