1月11日,英伟达悄悄发布了12GB显存版本的RTX 3080。这个大显存版本的RTX 3080在CES期间并没有被报道为关键。所以,2GB显存的这个版本在性能上有什么变化?以下是索泰GeForce RTX 3080 126x PGOC显卡的评测。
其实早在RTX 30显卡发布的时候,就有玩家质疑,作为这一代的旗舰产品,显存只有10GB,真的够用吗?不会爆成内存吗?
要知道现在的3A大作都是视频内存的大户。虽然显存并不是直接影响显卡性能的关键,但却可以成为显卡的瓶颈。比如一个游戏内存爆炸,即使性能再高,游戏帧数还是会停止。
索泰GeForce RTX 3080 126x PGOC
另外,12GB版本的RTX 3080 10GB不仅在显存上有所增加,在核心数量上也略有增加,所以与早前发布的RTX 3080 10GB版本相比,并没有太大的区别。让我们实际测试一下。在评测开始之前,笔者先列举一下这款显卡的特点,供大家阅读:
英伟达安培架构的01 GA102
索尼GeForce RTX 3080 126x PGOC显卡采用NVIDIA Ampere架构。我们先来看参数提升。
完成GA102内核
完整的GA102 GPU由7个GPC(图形处理集群)、42个TPC(纹理处理集群)和84个SM(流处理器)组成。GPC是一个主要的高级模块,具有所有关键的图形处理单元,每个GPC都包含一个专用的光栅引擎。在新的NVIDIA Ampere架构中,每个GPC还包含两个ROP分区,每个分区包含八个ROP单元。
GA102内核拥有283亿(28300万)个晶体管,面积为628平方毫米。基于三星8nm NVIDIA定制工艺,来自三星的GDDR6X内存。
GeForce RTX 3080 10GB内核
上图是RTX 3080 10GB版的核心,由6个GPC(图形处理集群)、34个TPC(纹理处理集群)和68个SM(流处理器)组成。
可以看到,虽然之前版本的RTX 3080 10GB也采用了GA102内核,但是内部被阉割了。RTX 3080 12GB在此基础上增加了核心数量,所以简单理解“12GB”版本并不准确,我们将在下面的测试中详细说明。
02索泰GeForce RTX 3080 126x PGOC概述
首先,我们来看看这款显卡的外观。索泰GeForce RTX 3080 126x PGOC显卡是索泰的旗舰“排骨饭”,在RTX 30系列显卡上进行了大幅升级。我觉得照明效率甚至达到了顶峰。
索泰GeForce RTX 3080 126x PGOC
索泰GeForce RTX 3080 126x PGOC整体尺寸为309×136×61mm,穹顶采用金属质感极强的深灰色和银色装饰,但装饰不是他们的重点。
索泰GeForce RTX 3080 126x PGOC灯效
全新的PGF系列显卡,电脑效果惊人,因为这个效果也值得把显卡竖着装。默认情况下,启动周期的RGB效果是逐渐变化的,从正面看像是未来技术。
索泰GeForce RTX 3080 126x PGOC
散热部分,索泰GeForce RTX 3080 126x PGOC采用PGF独家“守望散热系统”,8根热管,3个风扇,“冰镜”导热模块散热设计,可以让旗舰显卡稳定控温。此外,显卡还采用16+3相供电,二代铂料搭载SEP供电系统,让显卡工作更加稳定。
索泰GeForce RTX 3080 126x PGOC背板
索泰GeForce RTX 3080 126x PGOC的背板采用铝合金材质,整体采用磨砂质感,多重防锁结构,保护PCB不受外力作用而变形。
路由器空部分还可以辅助高热值的元器件散热。考虑到普通侧装显卡的用户,PGF系列显卡尾部有一个独特的信仰标志灯。
8+8+8引脚电源接口
索泰GeForce RTX 3080 126x PGOC显卡作为这一代的旗舰产品,默认功耗在350W左右,需要8+8+8pin的外接电源,推荐电源为750W及以上。
DP 1.4A * 3+HDMI 2.1 * 1四个接口
视频输出接口采用DP1.4a*3+HDMI 2.1*1的四接口设计,新的HDMI 2.1协议最高可支持单线8K视频输出,因此为超高分辨率提供了更好的扩展性。
03 3DMARK理论性能测试
首先,我们来介绍一下测试平台。为了保证本次评测能够充分发挥索泰GeForce RTX 3080 126x PGOC显卡的最佳性能,主板和CPU采用第11代桌面旗舰配置,具体如下:
测试成绩方面,基准测试用的是3DMARK,游戏性能测试用的是游戏自带的基准。同时,为了减少误差,每个测试分数测试三次,取平均值。
GPU-Z参数
先看GPU-Z的参数,目前这个软件还没有完全识别RTX 3080的12GB版本,但是已经可以看到一些主要参数了。
索尼GeForce RTX 3080 126x PGOC采用GA102核心,拥有8960 CUDA,超过10GB RTX 3080的8704 CUDA。
该卡频率为1260-1755MHz,采用美光12GB GDDR6X显存,位宽为384bit,显存带宽达到912.4 GB/s,比RTX 3080 10GB大了近152 GB/s。光栅单位和纹理单位分别为96和280。
以下是用来测量显卡DX11理论性能的3DMARK FS包:FS、FSE、FSU分别对应显卡在1080P、2K、4K的理论性能。显卡分数的实际测试结果如下:
3D标记FS包测试
在3DMARK FS suite对显卡DX11的性能测试中,索太GeForce RTX 3080 10GB PGOC相比RTX 3080的10GB版本,可以直观的看到性能的提升。当然这一方面要归功于核心数量和内存的提升;另一方面是因为我们在测试索泰的旗舰系列。
索尼GeForce RTX 3080 12g6x PGOC与公版RTX 3080 10GB显卡相比,DX11的综合成绩提升了8% 左右,而与RTX 3080 Ti的成绩相比 的差距在4% [/S2]左右。
3D标记TS包测试
另一方面,在DX12环境下的Time Spy和Time Spy Extreme测试中,索泰GeForce RTX 3080 126x PGOC相比RTX 3080 10GB版本提升约4% ,与RTX 3080 Ti的评分相差约3.5%。
3D标记光追踪测试
PortRoyal是专门为3DMARK中的光线跟踪性能设计的测试项目。索泰GeForce RTX 3080 126x PGOC相比RTX 3080 10GB版本提升约6%,与RTX 3080 Ti相差约5% 。
根据3DMARK的所有测试结果,RTX 3080 12GB版本不仅在显存上增加了2GB,而且在RTX 3080 10GB和RTX 3080 Ti之间整体性能有所提升。排除索泰旗舰系列的因素,仅按照标准频率,RTX 3080 12GB相比RTX 3080 10GB的提升约为3-4% 。
04游戏性能测试
在游戏性能测试中,我们选择了《刺客信条:灵魂之殿》、《无人区3》、《地平线5》、国产游戏《边界》和《光明记忆》的基准评分软件:Infinity。
另外,在游戏测试中,由于显卡驱动的版本更新和游戏更新对游戏帧数的影响很大,所以所有的基准测试分数都以这个分数为准。
刺客信条:魂殿游戏测试
一、《刺客信条:灵魂殿堂》。在实测性能上,RTX 3080和10GB的成绩差距明显,其他三款显卡差距很小,但RTX 3090在4K分辨率上依然强劲。
《无人区3》游戏测试
无人区3是一款漫画渲染风格的游戏。对性能要求下限低上限高,而且这款游戏的跑分也符合三款显卡的性能规律。
光明记忆游戏测试:无限
《光之记忆:无限》是闫飞群岛工作室开发的新系列《光之记忆》。正式版已经发售steam。只要48元,是小品游戏里的一大制作。
此外,我们不能在测试过程中关闭光线跟踪选项,因此所有测试结果都是在“RTX最高/DLSS质量”模式下进行的。这个demo演示涵盖了大量追光元素,大部分显卡跑分较低,4K分辨率下四款显卡差距不超过3帧。
边境游戏测试
在另一款国产游戏《边境》的跑分软件中,情况与《光明记忆:无限》基本相同,测试条件均在“RTX最高/DLSS品质”下进行。
地平线5游戏测试
在这次测试中,我们新加入了Horizon 5。作为这一代旗舰产品,我们测试了Sotec GeForce RTX 3080 126x PGOC在4K分辨率下不同画面的预设帧数表现。可以看到,在极限和低画质下,帧数差距近两倍。
05功耗和温度测试
在功耗测试中,我们选择FurMark软件进行复制测试,使用GPU-Z检测温度,功耗只针对显卡本身进行计算。
功耗测试(点击查看大图)
根据我们的实测,索尼GeForce RTX 3080 126x PGOC在满载情况下的单卡功耗约为350-360W,与RTX 3080 10GB版相差无几。建议搭配750W及以上。
温度测试
温度方面,索泰GeForce RTX 3080 126x PGOC已经抄了15分钟左右,温度稳定在68℃左右,内存温度80℃。
06精致军刀!
我以为只是简单的升级版显存,没想到NVIDIA给了我们很多惊喜。核心和显存数量的增加最终体现在性能上。
从产品定位来看,RTX 3080的12gb版本更像是RTX 3080 12GB的超频版本,不过这次是官方的超频,整体性能提升3-4%左右。
索泰GeForce RTX 3080 126x PGOC
价格方面,目前RTX 3080 10GB版最低市场价约8499元,而RTX 3080 12GB版市场价要贵1000-1500元左右。从性价比方面来说,显然RTX 3080 10GB更有优势,但目前RTX 3080 12GB的定价也是“合理”的。
但基于NVIDIA官方的“超频”,索泰GeForce RTX 3080 126x PGOC显卡再次升级,使得12GB版本的性能完美介于RTX 3080和RTX 3080 Ti之间。除了性能上的提升,PGF系列的灯光效果非常惊艳,不愧旗舰名。
索泰GeForce RTX 3080 126x PGOC
简而言之,这款RTX 3080 12GB版本并不是简单的内存升级,而是真正的性能升级。用户在购买时不用考虑是买新的还是旧的。早前发布的RTX 3080 10GB还是可以玩的,只要按需购买。
07附录1-光线追踪和DLSS效应
我们已经测试了光追和DLSS在上面一些游戏中的表现。游戏中的这些效果是什么?下面,我选两个游戏给大家看看。
《光明记忆:无限》RTX开启(点击查看大图)
《光明记忆:无限》RTX关(点击查看大图)
《光明记忆:无限》温泉场景下的追光效果是显卡最贵的性能。不难发现,最大的变化来自于水中的反射,而这组反射的计算是非常困难的。因为不是平静的水面,所以首先要考虑水面光线的变化,其次是光线对岸边鹅卵石的折射效果,最后结合前两种效果,照亮池底的光线。
赛博朋克2077·RTX on(点击查看大图)
《赛博朋克2077》RTX关(点击查看大图)
在赛博朋克2077,追光效果随处可见,游戏中也使用了不同的追光效果,包括最常见的追光反射和阴影,以及环境光明暗处理、漫反射照明和全局照明等更高级的效果。
RTX ON(点击图片查看大图)
RTX关闭(点击图片查看大图)
在网游《逆水寒》中,由于追光效果处于实验阶段,并没有像宣传片中那样出现水面反射。但是画面的整体阴影更真实,比如头顶树木的阴影,荷叶在水面上的效果。而且由于追光效果较少,开启功能后帧数并没有明显下降。
《堡垒之夜》RTX上映(点击查看大图)
《堡垒之夜》RTX关(点击查看大图)
《堡垒之夜》的追光效果相当明显,包括反射、全局光照、路径追踪等效果。卡车车身上的反光更明显,角色身上的环境光在开启追光后更真实。另外,仔细看的话,远处建筑的玻璃也有光的反射,整体画质提升非常明显。
《魔兽世界9.0》RTX on(点击查看大图)
《魔兽世界9.0》RTX关闭(点击查看大图)
《魔兽世界9.0》也是一款漫画渲染的网络游戏。魔兽的年龄更长,这次加光追在整体视觉上的效果不如堡垒之夜明显。然而,远处树木的影子,以及附近石台下面的影子都很明显。
“控制”RTX开启(点击查看大图)
“控制”RTX关闭(点击查看大图)
《控制》游戏使用的引擎物理效果极佳,追光开关的对比度也是肉眼可见。包括人在玻璃上的倒影,远处地面植物的倒影都很清晰,开灯后屋顶的明暗对比更明显。
在DLSS的对比测试中,第一个是明亮的记忆:无限。在这组对比中,从DLSS到DLSS表演的画面差距依然没有变化,但在超级表演模式下,墙壁的清晰度和轮廓有所下降。
当然总体来说,虽然DLSS做出了很大的贡献,但是可以看出《光明记忆:无限》在优化上做了很大的努力,这对于一个一个人主导的游戏来说是很难能可贵的。
赛博朋克2077 DLSS模式比较
在游戏《赛博朋克2077》中,以2K/RTX开启/DLSS关闭为标准,开启DLSS画质模式后,可以看到整体画面几乎没有变化,广告牌上的文字边缘依然非常清晰。在DLSS平衡和DLSS表现模式下依然状态良好,整体画质与原生画质无异。
DLSS模式在“逆水冷”中的比较[S2/]
图像质量描述
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,默认画质最高。帧数和画面在三种不同的模式下进行比较:关,快,超性能。
首先,关闭DLSS时,游戏帧数为原生画质26帧,开启DLSS快速模式后为41帧,开启DLSS超性能模式后为57帧。放大画面不难发现,原生画质和DLSS快速模式差别不大,而在DLSS超表现模式下,人物背后的装饰会模糊,木箱的纹理边界会有明显的变化。不过帧数增加非常明显。
DLSS模式在《无尽的抢劫》中的比较[S2/]
在《永恒劫》的DLSS对比中,可以注意到人物发带的编织纹理,每根头发的边缘都很清晰,肩膀上的服装图案也有明显的凹凸感。DLSS开启后,由于其工作原理是先放大再用AI算法放大进行边缘重建,在质量模式下,头发会丢失一些细节,但不仔细看很难发现,发带的细节也保留得相当完整。
在DLSS表演模式下,头发的质感更差,发带的编结感明显下降,腰部的配置边缘也模糊不清。最后,在DLSS超能模式下,整个角色无论是头发还是服装都会比较粘,所以如果不是非常热衷于高帧数的玩家,不建议开启DLSS超能模式。
08附录2-安培新特性
好的硬件没有软件的加持,就相当于空有长柄没有矛尖。要想发挥100%的力量,必须软硬结合,反之亦然。伴随着本次大会的启动,以下几项非常值得关注。
NVIDIA反射
以前我们关注的多是延迟,从显示器上了解到几毫秒的极快响应,但那只是终端的显示输出效果。你有没有想过从系统内部到你看到的实际画面有多大的延迟?
NVIDIA Reflex
NVIDIA在20系显卡中反复提到的“帧能赢”,在30系显卡中也有了进一步的突破,只不过NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC电竞和NVIDIA Reflex技术。
以前想测量系统延迟,需要高速摄像头和定制的LED鼠标电路。采用NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可以优化CPU和GPU中的渲染流水线,大大减少延迟时间,将整体系统延迟降低到30ms以下。但是,如图所示,您需要一个支持反射延迟分析的鼠标。
英伟达广播
英伟达广播是一款简单易用的专业直播软件。它的优势在于,主播不再需要任何背景布局,只需要一个普通的摄像头和一个GeForce RTX系列显卡。
活体宠物派对
这个软件可以让你凌乱的房间立刻变成一个直播间。内置音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法向DGX超级计算机进行深度学习。
nvec代码
同时,RTX 30显卡拥有目前最好的硬件解码器。大部分用户的电脑在直播时开启OBS流媒体后,CPU使用率会直接飙升到50%左右,基于GPU的NVENC解码可以大大减轻CPU负担。
NVIDIA工作室
对于内容创作者来说,提到的大部分软件可能只会想到与内容创作相关的软件,但是英伟达专门为内容创作者推出的NVIDIA Studio驱动程序才是连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动程序已经更新优化,可以更稳定地支持最新版本的Adobe系列软件,具有更出色的创作功能。使用NVIDIA CUDA技术,GPU加速特效可以实现更快的实时视频编辑和更快的渲染输出,让原本只能由软件编码输出的视频轻松得到硬件支持。此外,AI计算的优势,包括自动片段标记、特效跟踪和人脸识别,都显著提高了速度。
GPU渲染14.98秒,CPU渲染11分钟
当然,在NVIDIA Studio的加速创作中并不是只有Adobe一家,还有达芬奇、Keyshot、Blender、D5等专业软件都有非常亮眼的表现。不仅能提供强大稳定的运行环境,还能配合GPU加速,有效提高创作效率。
(7854705)
最新评论