如果您对 DragGAN 这个名字还不熟悉,请准备好迎接照片编辑领域的彻底变革。 使用复杂的工具和无穷无尽的 Photoshop 图层编辑图像的旧方法即将让位于全新的方法。 字面上令人着迷,如果你能通过这个词。
适合创意人士的全新“巨型玩具”
DragGAN的思想已经在一篇论文中表达过(我在这里链接) 由麻省理工学院、谷歌和宾夕法尼亚大学的研究人员组成的混合团队。 它将简单性提升到图像编辑的新水平。 它是一种不需要所有经典照片编辑工具的解决方案:画笔、图层和所有其他工具,这些工具使 Photoshop 等程序发家致富。
用户可以简单地点击照片上的关键点,创建“意图”点,然后拖动这些点来改变图像。 这几乎是魔术。

照片编辑进入第四维度
用外行的话来说,编辑照片中的元素的能力意味着什么(在照片的世界里) 它本身已经是“可计算的”) 用简单的鼠标拖动? 例如,您可以睁开闭着的眼睛、拉长裙子、放大或缩小汽车,同时保持逼真的外观,而无需对图像进行任何手动添加。
这项创新所带来的兴奋是显而易见的。 在其开发用户宣布后变得一团糟 DragGAN 网站:一个明显的迹象表明它在照片修饰的世界中引起了人们的兴趣,更普遍的是在图像编辑中。


DragGAN 与过去彻底决裂
Futuro Prossimo 最忠实的读者会记得我们对彼此说:le。 GAN(生成对抗网络)将能够“想象”,e 他们会造成破坏. 现在它发生了,您可能会再次问自己:但是 DragGAN 与其他照片编辑工具或 Midjourney 或 StableDiffusion(也可以组合使用)等生成式 AI 有何不同?
答案很简单:DragGAN 不生成图像。 它修改了它们。 字面上地。 它以一种令人惊讶的有效方式做到了这一点:如果你看两张照片,一张是用 DragGAN 编辑之前的,一张是用 DragGAN 编辑之后的,你将无法分辨这两张照片中的哪一张是原始照片。
DragGAN 能够做世界上任何照片编辑软件都做不到的事情,比如改变物体的角度,而不仅仅是它的视角,或者“发明”一切所需的细节,使一切看起来更逼真。
变压器。 它只是一个仍在研究中的工具。 我不敢想他准备好做弥撒时能做什么。

照片编辑的未来
想象一个世界,在这个世界中,只需发出语音命令即可更改图像,而无需任何特定技能。 DragGAN 是通向这样一个未来的第一块拼图。
想一想:“嘿谷歌,把这件衬衫变成红色的裙子,让模特戴上帽子。” 这可能是未来的常态,不再有鼠标或键盘。 拍摄的照片少得多。
有时没有。