一家未来派研究机构旨在利用人工智能来保存(并再现)人们的声音。
参与“语音银行”计划的研究人员希望改变所有因疾病或事故而失去发言权的人们的生活。 失去声音并不完全等同于暂时降低声音或声音嘶哑。 声音的丧失部分是身份的丧失。
这一切都源于波士顿东北大学与 沃卡利. 重要的是,为那些失去言语能力的人提供一种在咽喉癌或退行性疾病后保持其身份感的方法。 该项目将允许他们使用非常类似于自己声音的合成形式“讲话”。
这是该类型的第一个中心,将由教授领导。 VocaliD的创始人兼首席执行官Rupal Patel。
帕特尔说,该公司已经为个人提供了这样的服务,但是许多人缺乏足够质量的设备来正确采样人声。 建立“语音库”可以让未来的患者在有机会时保持自己的声音。
“通常病人在最后一刻来找我们,” 他说。 “他们没有足够的时间来保持自己的声音,因为他们受疾病,手术等等的支配。 而且非常令人沮丧”。
语音库
结果是与Northeastern的合作,将技术传播给公众。 该项目的核心是语音保护诊所,这是一个有可能失去声音的患者可以对其进行注册以保护它的中心。
这种方法比基于传统语音合成的方法要复杂得多: 机器学习算法可重建与呼吸有关的连字,音素甚至节奏。 在特别的展位中,记录了小故事,诗歌或不同主题的对话。 有人甚至开玩笑说自己失去了声音,这是一种自嘲的方式,可以应对巨大的恐惧。
“大约需要两三个小时的演讲时间。 通过这些录音,我们的人工智能能够生成具有相同声音的语音引擎。 就像将声音传给那些已经失去声音的人一样。”
再生的语音可以用作语音合成,通过转换书面文本进行语音表达,并且可以在明天集成 使用从思维路径生成文字,图像或动作的软件。
快速进步
帕特尔说,技术正在迅速发展,并且很快将能够再现与人类的语音没有区别的语音。
该团队还将能够“变老”声音以使其适应人的年龄,同时还不可能通过将其转变为成人来“成长”男孩的声音。