NVIDIA悄悄发布CFR SLI驱动,SLI或将以全新姿态复活

NVIDIA悄悄发布CFR SLI驱动,SLI或将以全新姿态复活

PC NVIDIA悄悄发布CFR SLI驱动,SLI或将以全新姿态复活

SLI正在走向消亡

传统的SLI技术(AFR)的思路是两块(多块)显卡各自拥有完全相同的完整游戏数据,同时进行游戏画面的渲染,然后交替输出的屏幕上。从而提高游戏画面的刷新率。这种技术最大的价值就是可以使游戏性能超过单块显卡的上限,实现更好的画面质量和刷新率。例如当年4K显示器刚刚面世的时候,就有很多玩家用2块甚至更多的980ti抢先获得了4K游戏体验。
但是这项技术也有巨大的缺陷:

  1. 每一帧的渲染时间并没有缩短,比如用2块显卡达到了60FPS的刷新率,但是每一帧还是消耗了33.3ms的时间。画面延迟并没有改善。
  2. 一些需要参照上一帧画面的渲染技法不适用于AFR。比如现在应用越来越广泛的TAA,动态模糊等。也是因为这些原因,开启SLI后可能会出现重影,闪烁等bug。
  3. 由于两块显卡不能完全同步,游戏帧数难以稳定,掉帧,跳帧时有发生。
  4. 针对每一款游戏都需要驱动给出针对性的profile,不仅不方便,而且也不是所有游戏都能从中受益。

从Pascal架构的10xx系列显卡开始,NVIDIA显卡的性能快速增长,对于大多数用户而言一块1080ti已经足以在1080p,1440p上流畅运行3A大作,而4K降低一些设置也能够勉强用单卡运行。所以虽然Pascal架构的显卡推出了SLI HB Link改善了SLI的性能,但是用SLI的玩家还是越来越少,网络上能单卡不双卡的呼声也越来越高。
而且新一代的图形API DX12包含了多GPU支持,游戏开发者可以将游戏的计算符合合理分配到多个GPU上,真正缩短每一帧的渲染时间,甚至可以共享多块显卡的显存。所以AMD和NVIDIA在DX12刚刚到来的时候也表明了态度:
“将不再支持基于驱动的SLI/Crossfire,希望游戏厂商使用DX12的多GPU功能对游戏进行优化”。
这个表态可以说给对SLI/Crossfire抱有最后期望的玩家泼了一盆冷水。

但是,DX12的多GPU功能使用起来极其繁琐,除了一些技术DEMO性质的游戏,主流游戏几乎都没有使用这项功能。
而单卡的性能其实还是不够的,因为虽然显卡的性能在不断提高,但是游戏的画面品质和性能需求也是水涨船高。直到现在的RTX2080ti,单卡仍然无法以最高品质达成4K 60FPS的目标,所以对于追求极致体验的玩家,SLI一直都有需求。

新的SLI技术悄悄到来

或许是看到了这个情况,在Geforce 441.41版本驱动中,NVIDIA悄悄加入了新的”CFR SLI”模式。
新的CFR模式SLI适用于DX10以上的所有游戏,包括DX12。

什么是CFR

CFR是(Checkerboard Frame Rendering)的缩写,即棋盘渲染。(PS4和XB1游戏主机为了实现4K画面,使用了叫做棋盘渲染的方式来减少每帧需要渲染的像素数,但是与这个CFR无关)。
从Pascal架构的GPU开始,NVIDIA使用了一种叫做Tile-Based Rendering 的技术,即将画面分割成像国际象棋棋盘一样的许多小块(Tile),然后一块一块进行渲染。这样每一块的数据很少,可以更高效的利用GPU缓存,提高渲染效率。
而CFR也正式利用了这一点,把“棋盘”上的黑色快和白色块分别交给两块显卡同时渲染,这样显然可以提高渲染的效率。
(理论上效率会提高100%,但是由于很多多边形是跨越多个Tile的,所以会造成一些重复的几何处理,所以性能提升达不到100%)
根据测试,使用CFR模式进行SLI比传统的AFR模式性能略有降低,实际游戏中双卡效率大约是单卡的130%到190%。但是CFR方式真正的缩短了每一帧的渲染时间,解决了AFR的诸多弊端。

被淘汰的SFR

其实最早的SLI就是采用了这种分割的思路,即SFR(Splitted Frame Rendering)。
这种方式将画面分成左右两半,每个GPU渲染一半。但是这种方式有两个比较大的缺陷:

  1. 游戏中左右的复杂度并不均匀,容易造成负荷分配不均。
  2. 画面中间部分的多边形跨越两个区域,两块显卡难以协同,只能分别重复渲染这些部分。而一般游戏的主要内容(主角等)恰恰大多在画面中间。

这两个问题使得SFR相对于单卡的性能提升很小,以至于被后来出现的AFR全面取代。

被复活的SFR

但是SFR的这些问题并不是不能解决的。CFR严格来说也是一种画面分割(SFR),但是由于是将画面分割成很多小块,所以分配到两块显卡的符合基本保持相等,从算法上解决了第一个问题。
而对于第二个问题,现在的游戏计算符合都在更加真实的光影上,重复处理一些集合计算已经不会对性能造成很大的影响。而且通过NV-link接口,两块显卡之间拥有了远高于当初SLI桥接时代的通信带宽,可以共享更多的数据。
所以,可以说CFR是以最新的技术在新的时代复活了SFR。

在441.41版本驱动中开启CFR

CFR方式的SLI还在测试阶段,尚未正式公开,所以需要用NvidiaProfileInspector开启:
cfr-sli
SLI模式需要选择SFR。由于上文提到过的,CFR需要NV-Link的高带宽支持,所以这项设置只有在启用了NV-Link的RTX20系列显卡上才会作为CFR生效。
这是一个全局设定,在441.41版本驱动上以下主流游戏获得了明显的性能提升。随着以后的驱动更新和正式发布CFR方式的SLI应该会更加完善。
在初版的441.41驱动下能够从CFR获得提升并且没有bug的游戏有:

  • Metro Exodus (DX11/DX12)
  • Borderlands 3 (Only DX11)
  • Chernobylite (Only DX11)
  • Crysis 3 (Only DX11)
  • Shadow of the Tomb Raider (Only DX11)
  • Deus Ex Mankind Divided (Only DX11)
  • A Plague Tale Innocence (Only DX11)
  • Mafia III (Only DX11)
  • Devil May Cry 5 (Only DX11)
  • Resident Evil 7 (Only DX11)
  • Resident Evil 2 Remake (Only DX11)

总结

目前为止,单卡性能迟迟不能满足4K 60FPS的游戏体验,而4K显示器却越来越普及,4K游戏逐渐成为基本需求。
以前,尽管AFR存在诸多问题,但是为了更好的游戏体验还是用很多人选择了它。
后来,人们把希望寄托于游戏引擎主动对多GPU进行优化,然而复杂的API带来了高昂的开发成本,现实并不像理想那么美好。
而浪费依然存在,效率依旧有限,但是通过驱动就能简单实现的CFR作为一个折衷或许能够在将来的一段时间内成为一个有价值的解决方案。

Ads