英伟达GeForce RTX 2070首测：干翻所有3A大作！

2018-10-17 15:09
新浪科技综合

　　NVIDIA GeForce RTX 2080 Ti与NVIDIA GeForce RTX 2080高举光线追踪大旗的时候，Founders Edition版本也将售价提升到了1199美元（国行9999元人民币）和799美元（国行6499元）的价格新境界。

　　这时候，定价599美元的NVIDIA GeForce RTX 2070 Founders Edition承担起了目前GeForce RTX 20系列显卡提升销售量和拯救钱包的重任。同时，英伟达也将其芯片代号命名为TU106，以明显拉开与TU104、TU102之间的差距。

　　那么NVIDIA GeForce RTX 2070到底能不能行？现在让我们直奔主题，NVIDIA GeForce RTX 2070 Founders Edition首测就此奉上。

　　TU106的野望

　　从宏观角度看，TU106与TU104和TU102在结构上有比较明显的区别，它既不支持英伟达引以为豪的NVLink，也不支持帕斯卡时代之前的SLI或者SLI HB。这也是为什么我们在GeForce RTX 2070顶端不会看到桥接扩展口的原因。

　　TU106一共有3个GPC（图形处理簇），TUP102的GPC（图形处理簇）数量为6个，TU104的GPC（图形处理簇）数量为4个。TU106的GPC（图形处理簇）中，每个GPC里面有6个TPC（纹理处理簇），每个TPC再包含2个StreamingMultiprocesor（流式多处理器，SM），每个SM中在包含数个CUDA Core，这也让GeForce RTX 2070最终获得2304个CUDA Core。

TU106 TU106

　　虽说相比GeForce RTX 2080 Ti动则4352个CUDA Core而言，只能说过半。但用来对抗对标的GeForce GTX 1070而言已经足够，事实上GeForce GTX 1070的SM（流式多处理器）数量只有15个，CUDA Core数量为1920。

　　由于TU106使用了台积电12纳米线宽制程（12FFN，N表示专为NVIDIA定制），并且相对GP104的GeForce GTX 1070给出了更多面积，445mm^2的芯片面积中总共塞入了108亿个晶体管。GP104芯片面积为314mm^2，16纳米线宽制程，72亿个晶体管。

　　有趣的是，GeForce GTX 1080同样也是GP104，芯片面积、制程、晶体管数量与GeForce GTX 1070如出一辙，只是在显存、TPC、SM、CUDA Core数量等细节上有所不同。请记住这一点，后面测试的对比部分事实上就是TU106与GP104之间的对决。

　　甚至在功率上GeForce RTX 2070都略占优势，GeForce GTX 1070 TDP为150W，GeForce GTX 1080 TDP为180W，GeForce RTX 2070 Founders Edition TDP为185W。虽然英伟达给第三方设计建议时会将GPU Boost频率下调到175W，但从经验来看直奔三风扇散热的显卡制造商们并不愿意在性能上输给对手，因此这一次的GeForce RTX 2070 Founders Edition更具备参考价值，甚至更高。

　　有意思的是，虽然面积增大，功率提升，但GeForce RTX 2070 Founders Edition的实际长度比RTX 2080/RTX 2080 Ti/GTX 1080/GTX 1070等显卡都有所缩减。表面上GeForce RTX 2070 Founders Edition也是个燃气炉，实际上是缩小了一些的燃气炉，不通过与其他显卡对比其实看不出来。

　　从满负载对比看来，GeForce RTX 2070的GPU温度限定与GeForce RTX 2080 Ti相当。风道改变之后热量拍出口由挡板接口处变成了显卡顶端，显卡表面温度不低。

　　由于显卡体积相对RTX 2080/RTX 2080 Ti/GTX 1080都有所缩短，GeForce RTX 2070 Founders Edition的电源口大方开在了显卡尾部，而非显卡顶端，给大机箱布线增加了一定的便利性。同时电源口仍然为8pin。

　　干翻3A大作

　　从制程到功率全面超越前一代GP104的GeForce RTX 2070没有任何会输的理由。按照惯例实践出真知，这里再次搬出确保不会拖后腿的爱活测试平台，先进行VRMark和3DMark相关测试项目，所有分数都包含了平台CPU测试分数，作为较接近实际的对比。

　　同时为了让大伙更容易看清楚GeForce RTX 2070在英伟达消费级显卡序列中的位置，陪跑的显卡还包括GeForce RTX 2080，GeForce RTX 2080 Ti，GeForce GTX 1070，GeForce GTX 1080，GeForce GTX 1080 Ti。所有显卡均为Founders Edition版本，嗯，就是这么任性。

　　在GeForce RTX 2080首测中我们说过，GeForce RTX 2080如果抛开RT Core和Tensor Core加持，实际表现大概比GeForce GTX 1080 Ti高出5%到10%。GeForce RTX 2070相对GeForce GTX 1070性能提升大概在25%到35%之间，相对GeForce GTX 1080性能提升10%到15%左右。

　　同样，游戏中测试的帧数也反映出了相似的性能表现。值得注意的是，为了能与旗舰级显卡确保同样的运行环境，所有游戏全部是在4K分辨率最高画质下运行，显示器型号为ASUS PA329Q 4K 10bit。而这一次英伟达官方给出的建议是1440p分辨率下以最高画质运行。

　　在大多数游戏中，游戏帧数都都在40到50fps之间徘徊。但对于大部分用户使用1080p分辨率显示器更普遍的情况来看，想让3A级大作在GeForce RTX 2070获得60fps以上刷新轻而易举。用来应付玩家们热衷于的1080p，144Hz电竞显示器根本不是什么问题。如果显示器能在1080p 144Hz的前提下还支持英伟达G-SYNC技术，关闭垂直同步，应付大作完全是美滋滋的状态。

　　旗舰卡待遇

　　从GeForce RTX 20系列此前的定价策略来看，英伟达基本上依照与GeForce GTX 10系列相应性能给出定价，并在此基础奉上诸如Tensor Core张量内核、RT Core光线追踪内核这样帕斯卡时代之前不曾见过的核心，以此印证买新不买旧的道理。

　　随着Windows 10十月更新放出，DirectX12加入DirectX Raytracing（DXR）技术，具备RT Core硬件结构的GeForce RTX系列将明显优于GeForce GTX全家，以及竞争对手AMD。而后者即使要从硬件上进行反击，也只可能是明年以后的事情。

　　只通过软件实现DXR如同登天，专业显卡Volta也仅能够通过Tensor Core张量内核来实现光线追踪去噪，唯有Turing图灵具备DXR的硬件加速要求。这是实打实的硬件门槛，这也意味着GeForce RTX 2070将是目前最便宜能获得这两项技术的显卡。

　　但目前所有宣称支持光线追踪的游戏还没有获得相应更新，再加上Windows 10十月更新包存在bug导致撤回了一段时间，多少延缓了游戏光线追踪技术的普及。

　　即便如此，我们仍然能够通过曾经运行在45万元人民币英伟达DGX Station工作站上的《星球大战Reflections》DEMO来一探究竟。没有RT Core核心的GeForce GTX 10系列瞬间吃足了大亏。

星球大战Reflections DEMO

英伟达DGX Station工作站

　　但无论如何，光线追踪可能最终实现效果也只能成为画质上的点缀，另外一个物理壁障Tensor Core张量内核对3A大作新游戏的帧数提升可是相当明显的。在图灵架构中，Tensor Core引入了INT8和INT4进行深度推理加速，最终引出了与我们游戏息息相关的技术：深度学习超采样DLSS。

　　具体实现表述我们同样在GeForce RTX 2080 Ti首测以及图灵架构浅析中进行了具体表述，这里只要记住。如果游戏中能够打开DLSS选项，就能在不损失的相同画质下提升帧数。也就是说，就算是同一款游戏同一个平台，DLSS能带来更好的游戏体验。

　　这里INFILTRATOR DLSS Benchmark和最终幻想15 DLSS Benchmark中就获得了相当经典的翻转例子。在TAA模式下，GeForce RTX 2070其实不如GeForce GTX 1080 Ti，但由于GTX系列不具备Tensor Core，无法运行DLSS，实际DLSS模式下GeForce RTX 2070比GeForce GTX 10系列所有显卡更为亮眼。

　　给提升留下后手

　　核心代号不一样不会阻止GeForce RTX 2070与顶级显卡一样拥有相同的待遇，包括加入对HDR BT.2100支持，DisplayPort 1.4，最高支持4K@120Hz输出，并且只有2个DisplayPort接口而非RTX 2080 Ti上的3个。支持VirtualLink的Type-C接口得到保留，原本第三个DisplayPort接口的位置变成了DVI口。

左为GeForce GTX 1070，右为GeForce RTX 2070

　　另外英伟达的GPU Boost 4.0以及NVIDIA Scanner也被引入其中，玩家不需要耐心的手动超频或者超频知识，只需要提供一个稳定的电源，功耗墙、频率、电压、风扇转速均由显卡自行调节。

　　NVIDIA Scanner的调节过程也相当简单，以EVGA Precision X1管理软件为例，在VF Curve Tuner界面中按下SCAN按钮即可。在接下来的20分钟时间内，你会觉得软件响应有所迟缓，观察HWM界面会发现，显卡GPU频率、GPU温度都在缓慢上升。

　　这个过程事实上就是管理软件在安全的范围内不断尝试GPU极限，但似乎并不针对显存频率进行提升。整个超频过程大概需要20分钟左右的时间，你可以把NVIDIA Scanner过程理解由程序不断试探GPU的功耗墙，省去玩家与GPU频率、电压、温度之间细微调整和反复博弈的过程。

　　最后，测试的成绩可以参考下图，通过NVIDIA Scanner自动超频，可以再获得5%左右的性能提升。

　　向实用玩家招手

　　如果说GeForce RTX 2080 Ti是业界新标杆，GeForce RTX 2080是GeForce GTX 1080 Ti的高性能加新技术的接替者，定价更趋于合理的GeForce RTX 2070完全有理由撬动GeForce GTX 1070和GeForce GTX 1080用户的钱包。再加上RT Core、Tensor Core加持，光线追踪和DLSS成为趋势，心动于新技术、新游戏，同时追求实用性的玩家而言，GeForce RTX 2070不偏不倚的达到了其中的平衡。

　　更何况传说中的GeForce RTX 2060不会这么快就到来，想在年内尝试到光线追踪以及DLSS新技术甜点，或者打算给原本电脑升个级的玩家，GeForce RTX 2070可圈可点的表现无疑成为浅尝RTX的最佳选择。更何况，即便应付传统游戏，制程、功耗、GDDR6显存的优势，仍然可以让GeForce RTX 2070有良好表现。

　　至少在iPhone破万，主流游戏CPU售价即将翻倍的大环境下，还可以选择英伟达GeForce RTX 2070来保护脆弱不堪钱包，已经实属不易了。