Make-A-Video，Meta 的 AI 从文本开始创建视频

詹卢卡·里乔（Gianluca Riccio）

30 2022月

技术

在从文本生成图像之后，是时候制作剪辑了：Make-A-Video 将扎克伯格的公司置于研究的领导地位。

我们还没有从疫情的到来中恢复过来达尔-E2, Meta宣布的Midjourney和同伴 制作一段视频，一种根据文本描述生成短视频剪辑的工具。这是人工智能生成内容世界的下一步。

这是文本到视频转换工具第一次如此接近最终发布。 “人工智能研究通过为人们提供快速、轻松地创建新内容的工具，正在推动创意表达的发展，”书中写道。新闻稿演示。

Make-A-Video 能够用几句话或几行文字将创意带入生活，并制作出色彩、人物和场景丰富的独特电影。该系统还可以将现有的照片或视频转换成类似的新电影。

伟大的射击，大卫

“生成视频比生成照片要困难得多，”Meta 首席执行官说道 马克·扎克伯格 在张贴在Facebook上. 但是去吧，我没想到。 “除了正确生成每个像素之外，系统还必须预测它们将如何随时间变化。 Make-A-Video 通过添加无监督学习层解决了这个问题，使系统能够理解物理世界中的运动并将其应用于传统的文本到图像生成。”

Il 网站 by Make-A-Video 展示了人工智能制作的一些示例视频，例如“一只穿着超级英雄服装、披着红色斗篷的狗在天空飞翔”和“泰迪熊画作”。这是这些系统令人难以置信的快速进步的又一次证明。只有两个？三年前？这些东西实际上是科幻小说。

制作视频，奇迹（当然还有危险）

随着我们越来越依赖人工智能来创作艺术，公司围绕这些算法采取透明度政策将变得越来越重要。阅读 Make-A-Video 背后的研究论文，很明显，这种人工智能是使用名为 LAOIN 的数据集的子集“训练”的，该数据集还包含不太干净的图像。哪个？伊斯兰国处决、未经同意的裸体等等。 Meta 确保它彻底筛选了这些数据，自动丢弃裸体和其他虚假图像。

将。与此同时，道德之争仍在继续。

将文本转视频作为艺术家和创作者的工具的引入也使人工智能生成艺术的合法性问题变得复杂化。八月，你知道吗，一个叫杰森·艾伦的家伙用 Midjourney 创作的图像赢得了一场艺术比赛，引发了马蜂窝般的争议。

即使是收集图像用于商业用途的公司（例如 Shutterstock 或 Getty Images）也对此类内容关闭了大门。在这种情况下，不存在道德问题。仅限合法。谁拥有算法训练所用的图像？将这些图像变成新事物是否侵犯版权？法律尚未适应。

与此同时，海啸仍在继续：这些技术确实让公众不知所措，其速度与它们在学习完善自身方面所表现出的速度相同。昨天宣布制作视频后仅一天公开发布 DALLE-2 由 OpenAI 提供。开发 DALLE-2 的公司已经取消了系统的等待名单，允许任何人从文本行生成图像。

但即使公众可以使用越来越多的人工智能艺术生成工具，有关其使用的一些基本道德问题仍然悬而未决：他们需要答案。

詹卢卡·里乔（Gianluca Riccio）Melancia adv 创意总监、文案撰稿人和记者。它是意大利未来研究所、世界未来协会和 H+ 的一部分。自 2006 年以来，他负责指导意大利未来学资源 Futuroprossimo.it。

报告研究、发现和发明， 联系编辑组！ 在 Whatsapp 上关注 Futuro Prossimo： 独家新闻和更新（免费）。

Fatto Quotidiano 上的 FP
阿尔贝托·罗比亚蒂 (Alberto Robiati) 和吉安卢卡·里奇奥 (Gianluca Riccio) 引导读者了解未来的情景：我们必须创造一个可能的明天的机会、风险和可能性。

关于同一主题：

最后

Make-A-Video，Meta 的 AI 从文本开始创建视频

技术

分享

伟大的射击，大卫

制作视频，奇迹（当然还有危险）

将。与此同时，道德之争仍在继续。

VASA-1，微软的人工智能仅用一张照片创建超现实的角色

Amodei，Anthropic：“人工智能很快就能自主复制和生存”

种间接触：SETI 研究所与鲸鱼“对话”

Quadroin，探索深渊的“企鹅”机器人

他们如何在实验室制造小地震来研究大地震

Photoncycle，氢“捕捉太阳”的钢瓶改变规则

VASA-1，微软的人工智能仅用一张照片创建超现实的角色

来自二氧化碳的能源：纳米发电机能否将污染变成资源？