来自的专家 Google Research 和戴尔'耶路撒冷希伯来大学 他们发展了 梦幻混音,可以使用任何材料创建与文本指令相对应的视频的软件。生成人工智能在保护所有形式的表达方面又向前迈出了一步(继 TESTI, 图像 e 音频). Dreamix 的特别之处在于它不仅限于文字说明,还接受参考照片或视频,以更好地适应用户的想法。
文字说明、图片、短片三种操作模式
从图像、剪辑或文本说明开始,Dreamix 提供三个主要功能: 视频编辑, 一代 图像视频 和一代 基于主题.
随着视频编辑,Dreamix 可以轻松播放输入视频并用您喜欢的对象替换元素。例如,你可以上传一个人切水果的片段,并要求AI用一片蛋糕代替水果。您可以提供一些玉米地的镜头并创建更具戏剧性的场景。 与往常一样,我将首先向您展示这两个示例的剪辑。
Dreamix 可以制作视频 从图像开始 (和/或文字说明)。在这个例子中,人工智能通过插入一条游泳的鲨鱼并让海龟移动,将静态图像转变为动态作品。位置和背景忠实于原始图像,而海龟的方向发生了变化。
三个功能中的最后一个允许 Dreamix 从显示同一主题的一小部分图像中创建动画视频。例如,如果您向该人工智能提供一些玩具消防员的图像,它会提取主体的视觉特征并将其动画化,以便主体可以执行文本指令中定义的操作。
总结一下
对于不仅依赖口头语言,而且还受到视觉艺术启发的创意人员来说,这项技术可能会改变游戏规则。目前,结果似乎仍然非常不确定,但它们仍然证明了人工智能理解文本指令和输入图像上下文的能力。
Dreamix 可以有效帮助加快故事板的创建或生成参考插图。目前它还没有向公众开放(我们想知道谷歌是否会使其成为响应 ChatGPT 的“旗手”之一),但是很快就会看到不同公司开发的这个工具或其他类似工具。
生成式人工智能注定也会在电视和电影领域发挥作用。您想要更多示例吗?这是整个演示文稿。