作为编辑,除了文本工作的主要工作内容外,我们经常需要考虑一个非常重要的问题:插图。
当然,所有的文字文章都不如图片文章那么引人注目,更不用说这段视频掌权的时代了。因此,每次我写一篇文章时,作者都应该仔细选择无版权图片网站上的图片,使图片符合文章主题,最好使用高分辨率图像。
然而,事故总是有的。有时人们会遇到分辨率不够但最合适的图像,这非常令人沮丧。直接将低分辨率图像插入到文章中显然会感到视觉不适。虽然PS甚至windows提供的绘图工具都可以修改图像分辨率,但强制拉伸的结果只会使图像变得非常模糊。
可以看出,拉伸图片后,图片边缘有明显的毛刺感。
有没有办法无损放大这张照片?
不要说,这是真的。这来自github“waifu2x”项目可以做到这一点。
项目地址是https://github.com/nagadomi/waifu2x,有兴趣的朋友可以研究一下。网址是http://W人工智能fu2x。udp。jp/
少说闲话。下面是使用waifu2x和普通拉伸图片(左侧拉伸和右侧使用waifu2x的效果)之间的比较。
可以看出,使用waifu2x放大图片后,“5g”边缘的毛刺感不再明显。虽然有些地方仍然存在噪音问题,但总的来说,它比直接拉伸要好得多。
那为什么waifu2x可以放大照片而不造成损坏呢?这是因为waifu2x使用了一种叫做srcnn的卷积算法。传统上图像超分辨率问题是如何在输入低分辨率图像(LR)时获得高分辨率图像(HR)。传统的图像插值算法,如最近邻插值、双线性插值、双三次插值等都能在一定程度上达到这种效果,但这些算法获得的高分辨率图像效果并不理想。
Srcnn是第一个使用CNN结构的端到端网络(即基于深度学习)超分辨率算法,它将是全部算法该过程采用深度学习方法实现,效果优于传统的多模块集成方法。srcnn的过程如下:首先,输入预处理。使用双三次算法将输入的低分辨率LR图像放大到目标大小。然后,该算法的下一个目标是通过对输入的模糊LR图像进行卷积网络处理,得到超分辨率的SR图像,使其尽可能与原始图像的高分辨率HR图像相似。
与双三次、SC、NE+LLE、KK、anr和a+相比,srcnn在大多数指标上的表现最好,恢复速度也处于前列,RGB通道的联合训练效果最好,这意味着与照片相比,waifu2x在放大插图(你最喜欢的二次图片)方面会有更多优势。
对于srcnn卷积算法,您可以访问https://arxiv.org/abs/1501.00092了解更多。
既然图片可以无损放大,那么视频呢?
当然,这个结果也是可行的,但这次使用的工具被称为TopazgigapixelAIforvideo。该软件通过数千个视频进行训练,并结合来自多个输入视频帧的信息,通过真实细节和运动一致性将视频放大到右侧8K分辨率。
作为一种人工智能软件,它需要一台快速的计算机。建议的系统配置为32GBram加上具有6GB或更大内存的NVIDIA图形卡。虽然它几乎不能在旧电脑上运行,但速度会非常慢。
Topazgigapixel视频AI如何放大视频?事实上,在安装时,您会发现该软件将被安装张量流图书馆和cudnn图书馆,所以很明显,该软件基于深度学习卷积神经网络处理每一帧并运行整个过程库达单位(否则就不会这么慢了)。
熟悉图形卡的老朋友知道,显卡作为计算机主机的重要组成部分,它是计算机进行数模转换的设备,承担着图形的输出和显示任务。图形卡与计算机主板相连。它将计算机的数字信号转换为模拟信号用于显示。同时,图形卡仍然具有图像处理能力,并可以辅助中央处理器努力提高整体跑步速度。对于从事专业平面设计的人来说,图形卡非常重要。民用和军用图形卡的图形芯片供应商主要包括AMD和英伟达两个(今年)Intel也将加入混乱战争)。
GPU其结构相对简单,具有大量的计算单元和超长的流水线,特别适合处理大量类型的统一数据,如矩阵乘法另外,图形卡在人工智能领域的应用也变得非常广泛。CUDA是NVIDIA推出的一个并行计算框架,只能用于GPU。只有安装这个框架,我们才能进行复杂的并行计算。主流深度学习框架也基于CUDA,用于GPU的并行加速,tensorflow也不例外。
不幸的是,用于视频的topaz千兆像素人工智能的价格仍然相对昂贵。近200美元的价格可以劝阻很多人,但它对修复或修复一些古代电影和电视作品非常有用。现在,可以在站点B上搜索的[4K修复]视频中有相当一部分是基于该软件制作的。
现在想想看,人工智能的出现确实解决了生活中的许多实际问题。没有卷积神经网络的快速发展,观看高清复制的古代影视作品可能只存在于想象中。
(7855060)
最新评论