一家未来研究所旨在利用人工智能保存(并重建)人们的声音。
参与“声音银行”计划的研究人员希望能够改变所有因疾病或事故而失去声音的人们的生活。失声与声音暂时减弱或声音嘶哑并不完全相同。声音的丧失部分是身份的丧失。
这一切都源于波士顿东北大学与 沃卡利. 为那些在喉癌或退行性疾病后失去说话能力的人提供一种保持认同感的方法非常重要。该项目将允许他们使用与自己的声音非常相似的合成形式“说话”。
这是该类型的第一个中心,将由教授领导。 VocaliD的创始人兼首席执行官Rupal Patel。
帕特尔说,该公司已经为个人提供了这样的服务,但许多人无法获得高质量的设备来正确采样他们的声音。创建“声音库”可以让未来的患者在还有机会的情况下保留自己的声音。
“病人经常在最后一刻才来找我们,” 他说。 “他们没有足够的时间来保护自己的声音,因为他们受到疾病、手术等的影响。这非常令人沮丧。”
语音库
结果是与Northeastern的合作,将技术传播给公众。 该项目的核心是语音保护诊所,这是一个有可能失去声音的患者可以对其进行注册以保护它的中心。
该方法比基于传统语音合成的方法复杂得多: 机器学习算法可重建与呼吸有关的连字,音素甚至节奏。 在特别的展位中,记录了小故事,诗歌或不同主题的对话。 有人甚至开玩笑说自己失去了声音,这是一种自嘲的方式,可以应对巨大的恐惧。
“你需要的大约是两三个小时的演讲。根据这些录音,我们的人工智能能够生成听起来相同的语音引擎。这就像把声音还给那些失去声音的人一样。”
再生的语音可以用作语音合成,通过转换书面文本进行语音表达,并且可以在明天集成 使用从思维路径生成文字,图像或动作的软件。
快速进步
帕特尔说,技术正在迅速发展,并且很快将能够再现与人类的语音没有区别的语音。
该团队还能够使声音“老化”,以适应人的年龄,但目前还不可能将儿童的声音“成长”为成年人。