很快,我们只需动动嘴唇就可以检查手机或听音乐,而无需说一句话。康奈尔大学的一组研究人员 他发展了 可以跟踪面部运动并将其解释为命令的声纳护目镜。
声纳护目镜的工作原理
张瑞东康奈尔大学的博士生是这个创新项目的幕后主脑。声纳眼镜使用微型麦克风和扬声器来检测我们无声“说出”的单词并将命令传输到我们的设备。该系统基于该团队的另一项发明——无线耳机,以及之前使用摄像头的模型。
得益于这种新造型,不再需要佩戴耳机或被相机框住。 张成康奈尔大学信息科学助理教授解释说,该系统需要几分钟的训练数据(例如读取一系列数字)来学习用户的发音模式。准备就绪后,声纳设备会向用户面部发送和接收声波,通过深度学习算法检测嘴唇运动并实时分析回声轮廓, 准确率为 95%。
致力于隐私的实际应用
该系统在您的智能手机上无线处理数据,使配件保持小巧且不引人注目。当前版本的声音检测电池续航时间约为 10 小时,并且由于没有数据离开手机,因此不存在隐私问题。
在考虑这项技术在现实生活中的可能用途时,隐私也是一个重要因素。 张建议声纳护目镜可用于在安静的图书馆中控制音乐播放(免提且无需观看),或者在嘈杂的音乐会中口述信息,而标准选项在这些情况下不起作用。
最令人兴奋的前景之一是有语言障碍的人可以使用这项技术,他们可以使用眼镜向语音合成器无声地“听写”文本,然后语音合成器会大声说出这些单词。 “我们相信眼镜将成为了解人类日常活动的重要个人计算平台,”张成说。
可穿戴技术的真正显着飞跃。