斯坦福大学研究人员在研发方面取得重大突破 脑机接口(BCI). 通过创造能够以每分钟 62 个单词的速度破译口语的技术,该团队将之前的记录提高了近 3 倍。
这一发展使这些系统更接近自然对话的节奏,并且几乎可以实现即时语音转换。
单词单词单词
Neuralink 的联合创始人和 Elon Musk, 马克斯·霍达克称斯坦福大学的研究是“脑机植入物效用的重大转变”。但它到底由什么组成呢?
所有工作的关键, 我在此处链接的论文中有详细说明,是使用机器学习算法将大脑信号“翻译”为连贯语音的能力。通过分析大脑皮层相对较小区域的大脑活动来做到这一点。
目标? 帮助因 ALS 等疾病而无法说话的人恢复声音。质量的真正飞跃:这种类型的声音界面可以显着加速大脑信号的解码。
测试
在一项实验中,研究小组(从大脑的两个小区域)记录了一名 ALS 患者的神经活动,该患者可以移动嘴巴,但难以形成言语。
使用可以预测文本的循环神经网络解码器,研究人员随后将这些线索转化为文字。 以前所未有的速度进行的单词。
人们发现,尽管大脑皮层瘫痪且延伸有限,但对面部运动和相关神经活动的分析足以支持脑机接口系统。
面临的挑战
目前该系统速度很快,但仍不完善:研究人员使用的递归神经网络 (RNN) 解码器的错误率 它仍然是20%。
研究人员深知这一点:“我们的演示,”他们写道,“证明从皮质内记录中解码尝试的言语运动是一种很有前途的方法,即使它还不是一个完整的、临床上可行的系统。”
为了提高错误率并优化算法,研究现在的目标是探测大脑的更多区域。
想象一下这些技术与人工智能的结合。 能够完美克隆语音的算法,例如 微软最近推出的一款 这只需要 3 秒的音频。
未来,没有人会保持沉默。