NVIDIA的GauGAN技术已经证明了它能够将简单的草图变成逼真的图像。此后,我们看到它被应用于NVIDIA Canvas,但似乎这个GPU巨头正以其人工智能(AI)瞄准更高的目标,它推出了可以将文本变成图像的新版本。
Nvidia在2019年首次展示了其GauGAN技术,但直到最近我们才看到它被应用到面向大众的产品中。这款名为Canvas的软件使用起来非常有趣,可以让用户用基本的草图创作出类似照片的惊人图像。
距离Canvas公布已经过去几个月了,但是GauGAN的工作一直在进行,现在已经到了2.0版本。这项技术更加令人印象深刻,因为它现在可以将文字转化为逼真的图像,提供类似于绘图的结果。
从上面的视频中可以看到,如果你在文本框上写了什么,一个图像会根据你的文本立即生成。在短语中添加一个形容词或替换一个名词会相应地改变图像。
为了增加个性化,用户可以将文本和绘图图像的功能结合起来。用户可以通过使用书面文字生成基础和绘画来细化图像,来改变图像中任何对象的形状、大小和纹理。
为了实现这些结果,英伟达的GauGAN 2文本图像功能使用了基于生成对抗网络的AI模型,该模型结合了分割映射、内部绘画和文本图像生成。这个模型是用1000万张风景图片训练出来的,所以对用户提供的任何东西都要做好充分的准备。
据悉,用户可以通过网页浏览器使用英伟达的GauGAN 2 AI交互演示。要尝试此功能,您必须首先同意NVIDIA的条款和条件。