我们还没有从疫情的到来中恢复过来 达尔-E2, Meta宣布的Midjourney和同伴 制作一段视频,一种根据文本描述生成短视频剪辑的工具。这是人工智能生成内容世界的下一步。
这是文本到视频转换工具第一次如此接近最终发布。 “人工智能研究通过为人们提供快速、轻松地创建新内容的工具,正在推动创意表达的发展,”书中写道。 新闻稿 演示。
Make-A-Video 能够用几句话或几行文字将创意带入生活,并制作出色彩、人物和场景丰富的独特电影。 该系统还可以将现有的照片或视频转换成类似的新电影。
伟大的射击,大卫
“生成视频比生成照片要困难得多,”Meta 首席执行官说道 马克·扎克伯格 在 张贴在Facebook上. 但是去吧,我没想到。 “除了正确生成每个像素之外,系统还必须预测它们将如何随时间变化。 Make-A-Video 通过添加无监督学习层解决了这个问题,使系统能够理解物理世界中的运动并将其应用于传统的文本到图像生成。”
Il 网站 by Make-A-Video 展示了人工智能制作的一些示例视频,例如“一只穿着超级英雄服装、披着红色斗篷的狗在天空飞翔”和“泰迪熊画作”。这是这些系统令人难以置信的快速进步的又一次证明。只有两个?三年前?这些东西实际上是科幻小说。
制作视频,奇迹(当然还有危险)
随着我们越来越依赖人工智能来创作艺术,公司围绕这些算法采取透明度政策将变得越来越重要。阅读 Make-A-Video 背后的研究论文,很明显,这种人工智能是使用名为 LAOIN 的数据集的子集“训练”的,该数据集还包含不太干净的图像。哪个?伊斯兰国处决、未经同意的裸体等等。 Meta 确保它彻底筛选了这些数据,自动丢弃裸体和其他虚假图像。
将。与此同时,道德之争仍在继续。
将文本转视频作为艺术家和创作者的工具的引入也使人工智能生成艺术的合法性问题变得复杂化。八月,你知道吗,一个叫杰森·艾伦的家伙用 Midjourney 创作的图像赢得了一场艺术比赛,引发了马蜂窝般的争议。
即使是收集图像用于商业用途的公司(例如 Shutterstock 或 Getty Images)也对此类内容关闭了大门。在这种情况下,不存在道德问题。仅限合法。谁拥有算法训练所用的图像?将这些图像变成新事物是否侵犯版权?法律尚未适应。
与此同时,海啸仍在继续:这些技术确实让公众不知所措,其速度与它们在学习完善自身方面所表现出的速度相同。昨天宣布制作视频后仅一天 公开发布 DALLE-2 由 OpenAI 提供。开发 DALLE-2 的公司已经取消了系统的等待名单,允许任何人从文本行生成图像。
但即使公众可以使用越来越多的人工智能艺术生成工具,有关其使用的一些基本道德问题仍然悬而未决:他们需要答案。