你能想象一只灰猫吗?出色地。现在,想象一下他有白色的皮毛。现在,想象他走在中国的长城上。完毕?在这里,在这些时刻,你大脑中一系列快速的神经元激活根据你之前对世界的了解,产生了所呈现的图像的变化。
对于我们人类来说,很容易想象。然而,对于人工智能来说,情况就完全不同了。尽管神经网络的进步在某些任务上达到或超过了人类的表现,但计算机仍然距离人类想象事物的能力还很远。
想象? 对 AI 来说是不可能的。 至少直到昨天。
现在,南加州大学的一个研究小组开发了人工智能,可以使用类似人类的能力来想象具有不同属性的前所未见的物体。这篇论文的标题是“群体监督学习的零样本合成” XNUMX月发布,从那时起,附属研究蓬勃发展。
该研究的主要作者表示:“我们受到人类视觉泛化能力的启发,尝试在机器中模拟人类的想象力。” 葛云浩。 “人类可以通过属性(例如形状、姿势、位置、颜色)分离他们学到的知识,然后将它们重新组合以想象一个新的物体。我们的论文尝试使用神经网络来模拟这个过程。”
人工智能的泛化问题
假设我们想要创建一个生成汽车图像的人工智能系统。首先,我们为算法提供一些汽车图像。任务是从多个角度生成多种类型、任何颜色的汽车。 这是一个严峻的挑战: 创建能够提取底层规则并将其应用于各种以前从未见过的新示例的神经网络。 但是今天的网络是根据样本特征进行训练的,而没有考虑对象的属性。
在这项新研究中,研究人员试图克服这一限制。
秘密? 这叫解开
研究小组的工作基于一种称为解缠结的方法的应用。解开可以用来生成 deepfake例如,合成新的图像和视频,用另一个人代替一个人的身份,但保持原来的动作。
新方法采用一组样本图像,而不是像传统算法那样一次一个样本。 Dd提取它们之间的相似性来实现所谓的“可控解缠表示学习”。
然后,它重新组合这些知识以获得“新的可控图像合成”。我们可以使用动词“想象”。
这与我们人类推断的过程非常相似: 当人类看到一个物体的颜色时,我们可以通过用新颜色替换原始颜色轻松地将其应用到任何其他物体上。 使用解开技术,该团队生成了一个包含 1,56 万张图像的新数据集,可以帮助该领域的未来研究。
想象有助于理解世界
虽然解开并不是一个新想法,但研究人员表示,他们的框架可以与几乎任何类型的数据或知识兼容。这拓宽了应用机会。
例如,在医学领域,解开可以帮助医生和生物学家通过将医疗功能与其他特性分离,然后将它们重新组合以合成新药物来发现更有用的药物。让机器进行“想象”也有助于创造更安全的人工智能。例如,允许自动驾驶车辆在训练期间想象并避免以前从未见过的危险场景。
“深度学习已经在许多领域展现了无与伦比的性能和前景。然而,这种情况往往是通过肤浅的模仿而发生的,并且没有对使每个对象独一无二的单独属性有更深入的了解,”计算机科学教授 Laurent Itti 说。 “这种新的解开方法第一次真正释放了人工智能系统的新想象力,使它们更接近人类对世界的理解。”