如果您对 DragGAN 这个名字还不熟悉,请准备好迎接照片编辑领域的彻底变革。 使用复杂的工具和无穷无尽的 Photoshop 图层编辑图像的旧方法即将让位于全新的方法。 字面上令人着迷,如果你能通过这个词。
创意人士的新“巨大玩具”
DragGAN的想法在一篇论文中表达过(我在这里链接)由麻省理工学院、谷歌和宾夕法尼亚大学的混合研究团队开发。它将图像编辑的简单性提升到一个新的水平。该解决方案不需要所有经典的照片编辑工具:画笔、图层和其他所有工具,而这些工具为 Photoshop 等程序带来了财富。
用户只需单击照片上的战略点,创建“意图”点,然后拖动这些点即可修改图像。这几乎是魔法。
照片编辑进入第四维度
用外行的话来说,编辑照片中的元素的能力意味着什么(在照片的世界里) 它本身已经是“计算性的”)只需拖动鼠标即可?例如,您可以睁开一个人闭着的眼睛、拉长裙子、放大或缩小汽车,同时保持逼真的外观,而无需对图像进行任何手动添加。
这种创新所产生的热情是显而易见的。宣布其开发后,用户一片混乱 DragGAN 网站:清楚地表明它在照片编辑领域(尤其是图像编辑领域)引起了人们的兴趣。
DragGAN 与过去彻底决裂
Futuro Prossimo 最忠实的读者可能还记得我们互相说:le。 GAN(生成对抗网络)将能够“想象”,例如 他们会造成破坏. 现在它发生了,您可能会再次问自己:但是 DragGAN 与其他照片编辑工具或 Midjourney 或 StableDiffusion(也可以组合使用)等生成式 AI 有何不同?
答案很简单:DragGAN 不生成图像。它修改了它们。字面上地。它以一种令人惊讶的有效方式做到这一点:如果您查看两张照片,一张使用 DragGAN 编辑之前,一张使用 DragGAN 编辑之后,您将无法辨别两张照片中哪一张是原始照片。
DragGAN 能够完成世界上任何照片编辑软件都无法做到的事情,例如改变对象的角度,而不仅仅是其视角,或者“发明”使一切变得更加真实所需的细节。
变压器。 它只是一个仍在研究中的工具。 我不敢想他准备好做弥撒时能做什么。
照片编辑的未来
想象一个世界,您只需发出语音命令即可编辑图像,而不需要任何特定技能。 DragGAN 是通往这样一个未来的拼图的第一块。
想一想:“嘿谷歌,把这件衬衫变成红色连衣裙,让模特戴上帽子。”未来可能会成为常态,不再有鼠标或键盘。拍的照片少得多。
有时没有。