Dreamix，一个谷歌人工智能从文本指令（以及更多）创建视频

詹卢卡·里乔（Gianluca Riccio）

8二月2023

vlLv1bK WEx3xTen.jpglarge

技术

根据文本说明、剪辑或图像，Dreamix 可以按照用户的说明创建视频。

分享

来自的专家 Google Research 和戴尔'耶路撒冷希伯来大学 他们发展了 梦幻混音，可以使用任何材料创建与文本指令相对应的视频的软件。生成人工智能在保护所有形式的表达方面又向前迈出了一步（继 TESTI, 图像 e 音频). Dreamix 的特别之处在于它不仅限于文字说明，还接受参考照片或视频，以更好地适应用户的想法。

视频按文字说明 — 一张图展示了 Dreamix 的“行为”逻辑

文字说明、图片、短片三种操作模式

从图像、剪辑或文本说明开始，Dreamix 提供三个主要功能： 视频编辑, 一代 图像视频 和一代 基于主题.

随着视频编辑，Dreamix 可以轻松播放输入视频并用您喜欢的对象替换元素。例如，你可以上传一个人切水果的片段，并要求AI用一片蛋糕代替水果。您可以提供一些玉米地的镜头并创建更具戏剧性的场景。 与往常一样，我将首先向您展示这两个示例的剪辑。

学分：梦幻

团队成员 : 梦幻混音

Dreamix 可以制作视频 从图像开始 （和/或文字说明）。在这个例子中，人工智能通过插入一条游泳的鲨鱼并让海龟移动，将静态图像转变为动态作品。位置和背景忠实于原始图像，而海龟的方向发生了变化。

学分：梦幻

三个功能中的最后一个允许 Dreamix 从显示同一主题的一小部分图像中创建动画视频。例如，如果您向该人工智能提供一些玩具消防员的图像，它会提取主体的视觉特征并将其动画化，以便主体可以执行文本指令中定义的操作。

学分：梦幻

总结一下

对于不仅依赖口头语言，而且还受到视觉艺术启发的创意人员来说，这项技术可能会改变游戏规则。目前，结果似乎仍然非常不确定，但它们仍然证明了人工智能理解文本指令和输入图像上下文的能力。

Dreamix 可以有效帮助加快故事板的创建或生成参考插图。目前它还没有向公众开放（我们想知道谷歌是否会使其成为响应 ChatGPT 的“旗手”之一），但是很快就会看到不同公司开发的这个工具或其他类似工具。

生成式人工智能注定也会在电视和电影领域发挥作用。您想要更多示例吗？这是整个演示文稿。

詹卢卡·里乔（Gianluca Riccio）Melancia adv 创意总监、文案撰稿人和记者。它是意大利未来研究所、世界未来协会和 H+ 的一部分。自 2006 年以来，他负责指导意大利未来学资源 Futuroprossimo.it。

报告研究、发现和发明， 联系编辑组！ 在 Whatsapp 上关注 Futuro Prossimo： 独家新闻和更新（免费）。

罗比亚蒂·里奇奥

Fatto Quotidiano 上的 FP
阿尔贝托·罗比亚蒂 (Alberto Robiati) 和吉安卢卡·里奇奥 (Gianluca Riccio) 引导读者了解未来的情景：我们必须创造一个可能的明天的机会、风险和可能性。

关于同一主题：

奥威尔超市：面部识别购物需要重新考虑

四月22 2024

VASA-1，微软的人工智能仅用一张照片创建超现实的角色

四月19 2024

Amodei，Anthropic：“人工智能很快就能自主复制和生存”

四月18 2024

档案

最后

过度旅游：威尼斯的门票是艺术之城的未来吗？

四月25 2024

电池回收2.0，墓碑上的主题是“电动汽车是还是不是？”

四月25 2024

合成但有生命：细胞挑战人工与生物之间的界限

四月25 2024

德国，一年前我们告别了核电：为什么他们不会回去

四月25 2024

赫库兰尼姆揭示柏拉图的秘密：重建他的结局

四月24 2024