首先我们来看GeForce RTX 3060这个型号,这款卡是首次采用GA106核心的入门级光追显卡,而此前发布的GeForce RTX 3060 Ti采用的是与GeForce RTX 3070相同的GA104,在核心内部做了改动。
第一代NVIDIA RTX架构 Turing下的RTX 2060
第二代NVIDIA RTX架构 Ampere下的RTX 3060
相较于上一代的Turing RTX架构,NVIDIAAmpere架构在算力上有着成倍的增长,这一点在RTX 3060中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060的着色器性能达到12.7 TFLOPS单精度性能,而Turing为6.5 TFLOPS。
NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RT Core达到24.9 RTTFLOPS,而Turing为19.5 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
例如最新发布的《赛博朋克2077》中,当玩家在游戏中遭遇赛车,追逐,打斗等激烈运动场景,第二代光追在架构上可以确保显卡渲染帧率相对更平稳,游戏体验上不会有频繁掉帧带来的顿挫感。
《赛博朋克2077》
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达102 TensorTFLOPS,而Turing为51.6 TensorTFLOPS。
在评测开始前,笔者为大家总结一些铭瑄GeForce RTX 3060 iCraft OC 12G显卡的特点,也方便大家有针对性的阅读:
满载拷机温度53℃
性能对位GeForce RTX 2070
中端性能,入门价格
总的来说,作为RTX 30系的入门级光追显卡,铭瑄 GeForce RTX 3060 iCraft OC 12G的整体规格并没有缩减多少,三风扇大尺寸依旧“派头十足”,而在拷机测试中也印证了这一点,满负载仅为53℃。性能上这款显卡对位RTX 2070,理论分数不超过3%,而这一差距在游戏中更小,约为2-3帧。
01铭瑄 GeForce RTX 3060 iCraft OC 12G外观
在RTX 30系显卡中,铭瑄的iCraft电竞之心系列依旧是主力型号,外观经过大面积改版,正面的导流罩部分相比RTX 20系采用了更多带有棱角的设计,这款铭瑄GeForce RTX 3060 iCraft OC 12G相比此前我们评测过的RTX 3060 Ti外观略微有区别,我们简单说明一下。
铭瑄 GeForce RTX 3060 iCraft OC 12G
铭瑄的电竞之心系列是玩家最为熟知的,属于旗舰系列,而在30系显卡中电竞之心也得到了全面的改版。整体给人感觉更大气了,正面导流罩部分相比20系的过度柔和,并且导流罩四周采用了镜面加灯带的处理方式,三个90mm的大风扇给了显卡本身足够的散热效果。
铭瑄 GeForce RTX 3060 iCraft OC 12G背板展示
显卡背板部分铭瑄也做了很多升级,首先增加了电竞之心的logo灯效,在左侧有冰蓝色的iCraft logo印刷,并有“SHOW YOUR BRAVE HEART”字样,翻译过来为“展示你无畏的心”,另外在核心部位有镂空设计方便GPU更好的散热。
另外这款铭瑄GeForce RTX 3060 iCraft OC 12G的背板装饰去掉了RTX 3060 Ti中的“斑马纹”装饰,采用更简约的几何线条。
铭瑄 GeForce RTX 3060 iCraft OC 12G
在显卡顶部,iCraft电竞之心的logo设计,相比以往的灯效来说,呈现的方式也更加活泼年轻化。在显卡内部散热方面,采用了4热管散热模组,热管采用回流焊工艺,导热更高效,散热更迅速。
铭瑄 GeForce RTX 3060 iCraft OC 12G视频输出接口
视频输出接口上,铭瑄GeForce RTX 3060 iCraft OC 12G采用DP1.4a*3+HDMI 2.1的4接口设计,另外新的HDMI 2.1接口可支持单线8K的视频输出。
铭瑄 GeForce RTX 3060 iCraft OC 12G供电接口
在供电方面,铭瑄GeForce RTX 3060 iCraft OC 12G将单8pin的供电挪到更靠近显卡尾部的位置,也是常见的接口设计。相比RTX 3060 Ti将供电接口放在显卡中部,更符合用户的使用习惯。另外这款显卡实测满载为170W左右,对于想换新显卡又不想换电源的用户非常友好,推荐的电源为550W及以上。
02NVIDIA Ampere架构下的RTX 3060
铭瑄GeForce RTX 3060 iCraft OC 12G采用了NVIDIA Ampere架构,我们首先来看一下GeForce RTX 3060的参数提升。
完整的GA106核心
完整的GA106 GPU包含3个GPC(图形处理集群)15个TPC(纹理处理集群)以及30个SM(流处理器)组成,GPC是占据主导地位的高级模块,拥有所有的关键图形处理单元,每个GPC包含一个专用光栅引擎。在新的NVIDIA Ampere架构中,每个GPC还包含了两个ROP分区,每个分区包含8个ROP单元。
GeForce RTX 3060采用GA106核心,拥有132亿5000万(13250 million)个晶体管,276平方毫米的面积,基于三星的8nm NVIDIA定制工艺,来自三星的GDDR6显存。
本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元,这使得每个SM的FP32运算单元数量提高了一倍,同时吞吐量也就变为了一倍。
而通常我们计算显卡的CUDA数量,并不是把SM中的所有单元加起来计数,而是只统计FP32单元的数量,所以这样一来,SM中的【FP32 : INT32】 从 1:1 变为 2:1。
GeForce RTX 3060共有3584个CUDA,其实它有1292个INT32单元,但由于内部的FP32数量翻了一倍,所以最终实现了3584的CUDA数量。
而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。
033DMARK 理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥铭瑄GeForce RTX 3060 iCraft OC 12G显卡的最佳性能,主板和CPU采用了如下配置:
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,GeForce RTX 3060采用GA106核心,三星8nm工艺,芯片面积276平方毫米,拥有3584个CUDA,铭瑄GeForce RTX 3060 iCraft OC 12G的Boost频率为1807MHz,相较公版的1777MHz有一定提升。采用12GB GDDR6显存,位宽为192bit,显存带宽达到了360 GB/s,光栅单元和纹理单元为48和112。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,我们可以看到铭瑄GeForce RTX 3060 iCraft OC 12G的性能更接近RTX 2070。不过因为采用GA106芯片,性能要比采用GA104芯片的RTX 3060 Ti相差较大。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,铭瑄GeForce RTX 3060 iCraft OC 12G的分数与RTX 2070进一步缩小。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,铭瑄GeForce RTX 3060 iCraft OC 12G的成绩相较RTX 2070的成绩低8%,同时要比RTX 3060 Ti的成绩低41%。
在理论测试中,铭瑄GeForce RTX 3060 iCraft OC 12G显卡对位上一代RTX 2070。不过作为RTX 30系中的入门卡,显卡的价格定位与上一代RTX 2060相同,但综合性能要比它高20-25%左右,性价比十足。当然现在最紧要的是能买到显卡,而价格何时能回落目前还无法预测。
04游戏性能测试
在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《光明记忆:无限》的benchmark跑分软件。
另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。
《刺客信条:英灵殿》游戏测试
首先我们来看看号称众生平等的刺客信条,游戏选择推出不久的《刺客信条:英灵殿》,在实测中我们发现虽然理论成绩上区别较明显,但游戏中铭瑄GeForce RTX 3060 iCraft OC 12G的分数与RTX 2070差距很小,几乎都在2帧左右。
《德军总部新血脉》游戏测试
《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值。铭瑄GeForce RTX 3060 iCraft OC 12G版在2K分辨率下也能跑出82帧的高水准。
《孤岛惊魂5》游戏测试
《孤岛惊魂5》同样算是优化比较到位的3A大作,不过相比德军总部的分数相对低一些,不过在2K分辨率下也能做到62帧的流畅运行。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏。虽然画风较卡通,但对于显卡的要求却比较高,比英灵殿甚至更吃配置。在“恶棍”特效下,铭瑄GeForce RTX 3060 iCraft OC 12G只能在1080P分辨率下稳定流畅运行。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。由于这个演示demo涵盖了大量复杂的光追元素,很少有显卡能在4K分辨率下流畅运行。
05温度与功耗测试
在温度功耗测试方面,室温24℃,我们并没有采用全封闭式的机箱,而是采用测试平台的方法,这样做可以最大限度的保证显卡除了自身散热外将风道等外因减小到最低。
功耗测试(点击查看大图)
功耗测试中,我们选择FurMark软件进行拷机测试,功耗仅计算显卡自身。作为一款入门级光追显卡铭瑄GeForce RTX 3060 iCraft OC 12G的功耗满载最高为170W左右,建议搭配550W及以上电源。
温度测试
温度方面,本次的铭瑄GeForce RTX 3060 iCraft OC 12G经过15分钟左右的拷机,温度稳定为53℃左右,这在目前的RTX 3060中算是非常低的温度了。
06部分游戏光追及DLSS效果展示
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
DLSS模式对比
DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
07软硬兼施 铸就Ampere
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
08入门首选
作为GeForce RTX 30系的入门级光追显卡,铭瑄 GeForce RTX 3060 iCraft OC 12G的整体规格并没有缩减多少,三风扇大尺寸依旧“派头十足”,而在拷机测试中也印证了这一点,满负载仅为53℃,给显卡提供了良好的工作温度。
铭瑄 GeForce RTX 3060 iCraft OC 12G
外观方面,铭瑄的电竞之心系列是玩家最为熟知的,在30系显卡中该系列也得到了全面的改版,整体给人感觉更大气,正面导流罩部分相比20系的过度柔和,采用了更多带有棱角的设计,并且导流罩四周采用了镜面加灯带的处理方式,三个90mm的大风扇给了显卡本身足够的散热效果。
铭瑄 GeForce RTX 3060 iCraft OC 12G
相信看过上面所有测试的用户会发现铭瑄 GeForce RTX 3060 iCraft OC 12G显卡对位RTX 2070,并且性能差距不超过3%,在游戏中的差距更小。
价格方面,虽然目前现在所有显卡首发价格均高于官方建议价格,但在全球缺货的窘况下也实属无奈之举。如果以两代产品的官方定价来看,RTX 3060与RTX 2060相同,可以说以入门级的价格买到上一代中端产品的性能,非常划算。
铭瑄 GeForce RTX 3060 iCraft OC 12G
虽然同样作为入门级光追显卡,但RTX 3060相比RTX 2060,采用了全新的NVIDIA Ampere架构,拥有更纯熟的第二代RT Core和第三代Tensor Core,在光线追踪和AI学习方面都有不同程度加强,对于目前的游戏将会有着更好的性能表现。