一种新算法通过编辑文本抄本，将视频中的人们“放入口中”。

詹卢卡·里乔（Gianluca Riccio）

六月6 2019

技术

技术巨头之间的合作允许仅通过更改文本转录来更改视频中的语音：电影中的人更改嘴唇的单词和动作。

分享

改变视频变得非常容易（我认为这不仅仅是一件好事），人工智能的最新发展确实令人印象深刻。

巨头（斯坦福大学和普林斯顿大学以及马克斯普朗克信息学研究所和 Adobe）之间的合作使得只需修改文本转录即可改变视频中的演讲，而无需创建“配音”效果。

换句话说，在视频上讲话的人会从字面上改变讲话的语言，同时也会改变嘴唇的动作。

为了获得这个有点令人不安的结果，算法“学习”视频中主体的音素及其发音，并创建其面部的精确 3D 模型，能够复制所有声音和动作： 那时，编辑语音文本就足够了，算法将替换原始句子。

目前，该算法需要至少 40 分钟的镜头来“训练”复制电影中的人物。

这是演示系统工作方式的视频：

巨大的道德怀疑

显然，这种机制创造了一种可能性，即任何人都可以通过插入仇恨或虚假信息并将其传播为原始和自然的方式来修改话语（可能是政治人物或公众人物）：这只会增加对基于系统的传播的担忧在deepfake上。

另一方面，也有一些积极的一面，那就是通过避免因微小的发音错误而重新拍摄整个场景，剪辑将获得巨大的节省。

除此之外，我确信还会为视频开发其他“防伪”方法：动态水印或使人工智能的工作变得更加复杂的水印，在现实与操纵之间的竞争中，这似乎已经注定了特征未来几年。

有关研究的更多信息，请点击此处

詹卢卡·里乔（Gianluca Riccio）Melancia adv 创意总监、文案撰稿人和记者。它是意大利未来研究所、世界未来协会和 H+ 的一部分。自 2006 年以来，他负责指导意大利未来学资源 Futuroprossimo.it。

报告研究、发现和发明， 联系编辑组！ 在 Whatsapp 上关注 Futuro Prossimo： 独家新闻和更新（免费）。

罗比亚蒂·里奇奥

Fatto Quotidiano 上的 FP
阿尔贝托·罗比亚蒂 (Alberto Robiati) 和吉安卢卡·里奇奥 (Gianluca Riccio) 引导读者了解未来的情景：我们必须创造一个可能的明天的机会、风险和可能性。

关于同一主题：

Google Gemini 来了，它让你惊叹不已：但是什么时候可以使用它呢？

7月2023

沉浸在未来：人工智能和虚拟现实将如何重新定义我们的物理现实

21/十一月/2023

SciMatch：自拍并认识你的灵魂伴侣

十月2 2023

档案

最后

Quadroin，探索深渊的“企鹅”机器人

四月20 2024

他们如何在实验室制造小地震来研究大地震

四月19 2024

Photoncycle，氢“捕捉太阳”的钢瓶改变规则

四月19 2024

VASA-1，微软的人工智能仅用一张照片创建超现实的角色

四月19 2024

来自二氧化碳的能源：纳米发电机能否将污染变成资源？

四月18 2024