你能想象一只灰猫吗? 好的。 现在,想象一下他穿着白色的皮毛。 现在,想象他走在中国的长城上。 完毕? 在这里,在这些时刻,您大脑中的一系列快速神经元激活产生了所呈现图像的变化,这基于您先前对世界的了解。
很容易想象,对于我们人类来说。 然而,对于人工智能来说,这是另一回事。 尽管神经网络取得了进步,在某些活动中达到或超过了人类的表现,但计算机仍远未达到人类想象事物的能力。
想象? 对 AI 来说是不可能的。 至少直到昨天。
现在,南加州大学的一个研究团队开发了人工智能,它使用类人的能力来想象一个具有不同属性的前所未见的物体。 该文件名为“Zero-Shot Synthesis with Group-Supervised Learning”, XNUMX月发布,从那时起,附属研究蓬勃发展。
“我们受到人类视觉概括技能的启发,试图在机器中模拟人类的想象力,”该研究的主要作者说。 葛云浩. “人类可以通过形状、姿势、位置、颜色等属性将他们学到的知识分开,然后重新组合以想象一个新的物体。 我们的文章试图使用神经网络来模拟这个过程”。
人工智能泛化问题
假设我们要创建一个生成汽车图像的人工智能系统。 首先,我们为算法提供了一些汽车的图像。 任务是从多个角度生成任何颜色的多种类型的汽车。 这是一个严峻的挑战: 创建能够提取底层规则并将其应用于各种以前从未见过的新示例的神经网络。 但是今天的网络是根据样本特征进行训练的,而没有考虑对象的属性。
在这项新研究中,研究人员试图克服这一限制。
秘密? 这叫解开
研究小组的工作基于一种称为解开的方法的应用。 解开可用于生成 deepfake例如,合成新的图像和视频,将一个人的身份替换为另一个人,但保持原始动作。
新方法需要一组样本图像,而不是像传统算法那样一次一个样本。 Dd 提取它们之间的相似性以获得称为“可控解缠表示学习”的东西。
然后,它重新组合这些知识以获得“新的可控图像合成”。 我们可以使用动词“想象”。
这与我们人类推断的过程非常相似: 当人类看到一个物体的颜色时,我们可以通过用新颜色替换原始颜色轻松地将其应用到任何其他物体上。 使用解开技术,该团队生成了一个包含 1,56 万张图像的新数据集,可以帮助该领域的未来研究。
想象有助于理解世界
虽然解开并不是一个新想法,但研究人员表示,它们的结构几乎可以与任何类型的数据或知识兼容。 这扩大了应用的机会。
例如,在医学领域,untangling 可以帮助医生和生物学家通过将医学功能与其他属性分离,然后将它们重新组合以合成新药,从而发现更多有用的药物。 能够让机器“想象”也有助于创造更安全的人工智能。 例如,允许自动驾驶汽车想象和避免训练期间从未见过的危险场景。
“深度学习已经在许多领域展示了无与伦比的性能和前景。 然而,这往往是通过肤浅的模仿而发生的,并且没有更深入地了解使每个对象独一无二的独立属性,”计算机科学教授 Laurent Itti 说。 “这种新的梳理方法第一次真正释放了人工智能系统的新想象力,使它们更接近人类对世界的理解。”