N卡新编码功能实测:游戏主播提升效率的秘密武器 _ 游民星空 GamerSky.com
gamersky
近日,NVIDIA对图灵显卡的直播推流进行了一次升级,主要特点就是让直播显得更加流畅,画质更加清晰,不过这次的优化升级主要针对的是图灵架构显卡。

那么,使用NVIDIA的图灵显卡(GTX 16和RTX 20系列)在直播中会得到怎样的提升?它们较原版又有怎样的表现?让我们一起来看下吧。

NVIDIA在去年年底的时候正式发布了图灵系列显卡,新的架构确实让人眼前一亮,同时相比普通的GPU架构。图灵系列显卡还加入了2个核心单元——1个是用于计算“实时光线追踪”的RT Core,另一个则是增强显卡人工智能学习的Tensor Core。
两个功能一个可以让显卡变得更“聪明”,一个可以在运行“实时光线追踪”技术时能够为显卡辅助计算包围盒分类以及射线和三角求交。

简单的介绍了现有图灵架构,那么再来说下现有直播推流方式,我们常见的直播推流方式有CPU编码(H.264或H.265),不可否认的是,CPU编码是目前来讲画质最为清晰的一套编码方案。当然,也是最占用电脑性能的一套方案,它通常会大量占用高规格、高核心数量的处理器性能,使得电脑性能的发挥会整体下降一个层次。
事实上,这在普通娱乐主播方面还算好,但是要直播游戏,甚至是绘图、视频编辑,那么其程序本身对处理器性能的要求就非常高,所以选择CPU编码模式,除非是非常好的处理器,否则性能的下降不仅会影响自身的表现,也会影响观众的体验。

为了防止这一题问题的发生,解决CPU压力的问题,NVIDIA推出的CUDA编码模式,其功能是使用NVENC调用CUDA核心,在处理图像性能的时候同时也对视频进行编码,这样使得显卡在输出源画质信号的同时像推流软件再输出一份“简化版”的。也因此,通过图形显卡来处理图形,会比处理器处理图形更有速度方面的优势。并且相较于CPU编码,这个速度是真的提升了好多。
但由于是简化版,所以在显示画质方面,会较CPU编码差了许多。
在之前大家会在画质和速度方面进行纠结——要么选择CPU编码,画质好但是会大幅降低系统性能和游戏运行速度。要么选择NVIDIA CUDA编码,画质会不如CPU编码但是只会小幅度降低系统性能和游戏运行速度。

新一代的NVIDIA编码器主要是针对图灵架构的,其目标显卡以GTX 16系和RTX 20系列显卡,主要作用是通过Tensor Core(人工智能核心)来辅助CUDA进行图形、图像处理。
虽然同样是进行图像处理,但是较原有的NVENC,增加了辅助计算核心可以使显卡在运行游戏并进行更高效率的图像编码处理。

根据NVIDIA的官方接招,新的模式会使整体的处理性能比原有的帕斯卡架构还要提高15%,也因此会有更加富裕的经历去做图形质量的优化。
总之就是一句话,比以前的NV编码图像更好了,直播占用率性能也下降了。
那么,它的画质提升了多少,占用率又下降了多少?就让我们一起来测试下吧!
文章内容导航
- 第1页:直播编码的新选择
- 第2页:测试平台介绍
- 第3页:测试游戏及设置介绍
- 第4页:“虎牙直播”软件设置介绍
- 第5页:三种编码模式的流畅度及画质对比
- 第6页:帧数对比及总结
测试平台介绍

首先介绍下本次测试所使用的平台,测试平台使用的是Intel的顶级处理器i9-9900K。然后是选择了微星的Z390 Gaming Pro Carbon AC主板。此外,我们选择了2根海盗船的白金统治者8GB DDR4-3600内存,组成了16GB的双通道模式。

整体使用的测试平台如上图所示,为了达到最佳效果我们使用的是Intel的顶级处理器和NVIDIA的图灵架构次旗舰级显卡以及帕斯卡架构旗舰级显卡。

MSI Geforce RTX 2080 8G DUKE暗黑龙爵显卡。

微星 GeForce GTX 1080 Ti 11G DUKE 暗黑龙爵显卡。
测试使用到的显卡为微星的RTX 2080暗黑龙爵,同时我们的对比显卡为微星的GTX 1080 Ti暗黑龙爵。两款显卡中,RTX 2080为图灵显卡的次旗舰级水准,GTX 1080 Ti则是帕斯卡的旗舰水准。两者在性能方面相差并不算太多。

使用的主板是来自微星的Z390 Gaming Pro Carbon AC主板,又称暗黑主板,该主板主要特点是采用了双8Pin CPU辅助供电设计,能够为超频玩家带来更加稳定的CPU供电。

使用到的内存为海盗船的白金统治者RGB,其频率为DDR4-3600,两条8GB组成了共计16GB的双通道模式,其时序为16-18-18-36。

使用到的电源为海盗船的AX1000,这是一款钛金认证的全模组电源,也是海盗船的次旗舰级产品。
文章内容导航
- 第1页:直播编码的新选择
- 第2页:测试平台介绍
- 第3页:测试游戏及设置介绍
- 第4页:“虎牙直播”软件设置介绍
- 第5页:三种编码模式的流畅度及画质对比
- 第6页:帧数对比及总结
测试游戏及设置介绍:

本次测试使用游戏的是《古墓丽影:暗影》这款自带Benchmark程序的游戏,并且该游戏支持“实时光线追踪”技术,所以我们会对它来进行更加详细的测试。
同时Benchmark的特点就是测试场景统一,重复性比较强,而《古墓丽影:暗影》这款游戏选择了3个场景来进行测试,所以在测试效果方面会比较全面一些。

在测试古墓丽影的时候,我们统一使用的是1920*1080分辨率(比较遗憾的是目前国内绝大多数直播平台都不支持2K以及更高分辨率)。采用的是时间抗锯齿模式。

画质方面我们使用的是系统默认的“最高”画质,仅将预设值设置为“最高”其它一概不动。
文章内容导航
- 第1页:直播编码的新选择
- 第2页:测试平台介绍
- 第3页:测试游戏及设置介绍
- 第4页:“虎牙直播”软件设置介绍
- 第5页:三种编码模式的流畅度及画质对比
- 第6页:帧数对比及总结
“虎牙直播”软件设置介绍:

本次测试使用的是“虎牙”直播平台(因为斗鱼想要达到蓝光直播效果需要达到一定条件),而虎牙直播则没有这个限制(我们需要通过另一台机器来对直播内容进行截图,对比下整体效果)。

在“虎牙直播”软件的上边,可以看到性能设置栏中的编码设置分为自动配置(默认)、CPU H.264编码、NVIDIA H.264硬件编码(降低CPU性能)以及NVIDIA H.265硬件编码(限NVIDIA950及以上显卡)和CPU H.265编码。
我们的测试会分为3个部分,使用CPU H.265编码以及NVIDIA H.264硬件编码和NVIDIA H.265硬件编码。
不过值得一提的是,虽然虎牙的NVIDIA H.265硬件编码后边备注是(限950及以上显卡),但是经过测试,使用非图灵显卡会出现直播软件崩溃的情况(使用GTX 16系列显卡和RTX 20系列显卡则不会出现这个问题),所以在经过测试和虎牙客服进行沟通后我们得出结果——目前使用帕斯卡架构的显卡是无法开启NVIDIA H.265硬件编码进行直播的。

除了自身测试之外,“虎牙”客服也对此做了明确的确认,并非个人原因导致。
因此主要的测试项目为:
1,微星RTX 2080暗黑龙爵显卡在开启默认“最高”画质下, CPU H.265编码、NVIDIA H.265硬件编码以及NVIDIA H.264硬件编码下的Benchmark跑分测试。
2,微星GTX 1080 Ti暗黑龙爵显卡在开启默认“最高”画质下, CPU H.265编码以及NVIDIA H.264硬件编码下的Benchmark跑分测试(取消了、NVIDIA H.265硬件编码)。
当然,考虑到部分主播在直播的过程中有开启录像功能的习惯,所以以上两项、我们分别开启录像和关闭录像功能对其进行了测试。因此,我们在两项测试中均加入了正常状态的测试帧数,以做对比使用。
文章内容导航
- 第1页:直播编码的新选择
- 第2页:测试平台介绍
- 第3页:测试游戏及设置介绍
- 第4页:“虎牙直播”软件设置介绍
- 第5页:三种编码模式的流畅度及画质对比
- 第6页:帧数对比及总结
三种编码模式的流畅度及画质对比:

首先对比的是3种不同编码下的观众界面,经过测试,系统推荐我们使用虎牙直播的蓝光4M画质来进行播放。

同时另外一台机器开启虎牙客户端然后使用蓝光4M清晰度来进行全屏观看,并使用录屏软件记录下直播的画面。

测试分为CPU H.265编码、NVIDIA H.265硬件编码以及NVIDIA H.264硬件编码对比。
测试使用的显卡均为RTX 2080。
通过对比,我们不难发现,其实NVIDIA H.265硬件编码在画质方面已经和CPU H.265没有多少区别了,甚至在上边的对比中玉米细节的表现已经超越了CPU的H.265编码。不过相比之下,NVIDIA H.264偶尔在细节方面还是有一点欠缺。
可以说单论画质而言,使用NVIDIA显卡进行编码并不会逊色于CPU编码的效果,那么在游戏运行速度方面又是如何呢?
文章内容导航
- 第1页:直播编码的新选择
- 第2页:测试平台介绍
- 第3页:测试游戏及设置介绍
- 第4页:“虎牙直播”软件设置介绍
- 第5页:三种编码模式的流畅度及画质对比
- 第6页:帧数对比及总结
帧数对比:
在之前就说过,我们考虑到有些主播们在进行直播的同时还会开启录像功能,以方便后期剪辑同时在视频网站上传。所以我们下边下边的测试分别是针对开启录像和未开启录像,然后使用默认最高画质来进行三种状态的对比。

注:上图中对比正常帧数就是普通跑Benchmark,并没有开启录像功能。
首先是开启录像的测试成绩对比,首先可以确定的是无论开启哪种编码模式来进行直播,都会对游戏有较大的损失在三者的表现中,原有的NVIDIA H.264硬件编码速度最快。其次是新加入的NVIDIA H.265硬件编码,仅比原有NVIDIA H.264硬件编码慢了一点。
而CPU的H.265硬件编码对性能的需求最高,会导致严重降低帧数。
但由于新的NVIDIA H.265硬件编码对GTX 10系帕斯卡显卡的兼容度比较差,所以我们没有测试GTX 1080 Ti下的NVIDIA H.265硬件编码效果。

然后是关闭录像功能后的性能对比测试,可以发现在直播过程中开启录像功能确实是会对游戏运行速度造成一定的影响。
而在关闭录像功能后可以发现,在使用RTX 2080暗黑龙爵显卡进行直播时NVIDIA H.265硬件编码以及H.265硬件编码都保持了相同的104帧。
当然最低的仍然是CPU H.265编码,仅有100帧。
而在GTX 1080 Ti方面,使用NVIDIA H.264编码的效果则只比CPU H.265编码多了1帧而已,其提升效果并不明显。
测试总结:
为了方便大家观看,我们最终还是列出一个测试总结来方便大家观看。

1,CPU H.265编码好用吗?
答:它是H.264编码的升级,其特点就是比CPU H.264改善了码流、编码的质量,比CPU H.264编码占用系统资源更少。不过由于它的CPU进行编码处理,所以占用系统资源越多(如开启录像)就会越影响到它的性能,CPU越高端,所造成的影响越小。
若在仅开启直播软件进行直播的情况下,使用i9-9900K处理器,它甚至比NVIDIA H.264 硬件编码仅低了一帧,但画质却有所提升。
而在开启直播和录像的情况下,i9-9900K也使得H.265较NVIDIA H.264编码低了7帧(8%左右)。所以如果你的CPU比较强大,那么如果是非图灵架构的显卡,使用CPU H.265编码会进行直播会比较好。
2,NVIDIA H.265硬件编码好用吗?
答:虎牙直播的NVIDIA H.265硬件编码目前可以看做是针对图灵显卡专门优化的一个编码,尽管它的提示是(仅支持GTX 950及以上显卡),但目前看来对图灵以外的显卡还有待优化(之后应该会增加GTX 10系及GTX 9系显卡的支持)。所以目前除了图灵显卡(我甚至用GTX 16系显卡进行测试也是没有问题),哪怕是GTX 1080 Ti也是会出现直播报错的现象。
首先在画质方面,它的质量是最好的,然后是速度方面,它也是最快的。无论是开启还是关闭录像功能。所以,如果玩家们使用的是图灵显卡,那么NVIDIA H.265硬件编码是最适合你的直播方式。如果非图灵显卡,那么还是根据CPU情况来选择CPU H.265或是NVIDIA H.264硬件编码吧。
不过后期随着虎牙直播软件的更新,也许NVIDIA H.265硬件编码很快就会支持图灵以外的显卡了。
3,选择NVIDIA编码的优势是什么?
答:直播是件很吃配置的事情,什么都不管先划走20%-30%的性能实在是一件比较郁闷的事情,所以剩下的运行空间往往就得让主播们精打细算了。剩下的空间主播们也许再开个连麦工具,开个弹幕提示器,再开个语音感谢功能?
甚至有的主播还会开启摄像头、加速器甚至是QQ聊天软件等工具。
越来越多的软件会对系统造成更多的负担,也因此最终的直播效果应该是会比测试更低的。
但不可否认的是,这些工具的开启,占用的都是CPU的压力。
与显卡相比,往往CPU的发热量也是不容忽视。即便是我使用i9-9900K,CPU H.265编码的帧数仍然是最低的。而在这样的情况下继续给CPU施加压力,只会让CPU的运算压力持续增长。相应的,满载运行带来的是温度的提升,整机温度提升带来的就是稳定性的问题了。
所以,虽然在前边我们也曾提到过推荐非图灵显卡使用CPU H.265编码或者NVIDIA H.264硬件编码两种形式,但我们针对的是采用的i9-9900K或者R7 2700X再或者i7-8700K这样多核心多线程的期间级处理器。对于CPU本来就不高的玩家,采用显卡的NVIDIA H.264硬件编码无疑是更好的选择。
4,应该如何选择使用CPU还是NVIDIA编码?
答:在这之前我们要弄明白一个问题,就是游戏帧数是由什么来决定的?
首先,CPU提供初始建模和一些AI的计算,然后告诉显卡屏幕上该显示什么。
但是,这一部分是CPU的部分,和显卡并没有太大的关系。也因此我们会发现很多RTS(即时战略类游戏)单位多了之后,即使再好的显卡也会卡顿,因为CPU带不动了。
显卡呢?就是将CPU决定要显示点东西,渲染成我们要看到的图像,再输出到显示器,而这个渲染的速度就是由显卡来决定的。简单的将,画面越精致、越复杂,渲染的速度就越慢。
所以,我们其实可以将其理解为,我们每一秒所得到的帧数,是由CPU和显卡中,拖后腿的那一个决定的。
如果我们选择CPU编码,而正好配置中CPU强、显卡弱,那么及时CPU在承担了编码的负担后,依然不会拖显卡的后腿,其帧数反而有可能比使用显卡编码更快。
那么如果CPU和显卡差不多,或者显卡更强呢?由于CPU高密度并行计算的特点十分擅长视频编码,所以在计算能力方面完全不会拖后腿,这也是多数情况下,选择GPU编码流畅度会比CPU编码好许多的原因。
在游戏PC的应用实践中,大多数情况下显卡定位会大于CPU,可优先考虑用NVENC来编码推流;但如果是CPU定位远高于显卡的少数情况,尤其是那些用顶级多核CPU的,也可以试一下CPU编码,可能游戏帧数会比显卡编码更高。
当然,这是针对图灵架构以外显卡的选择。
而对于图灵架构的显卡呢?得益于图灵架构及NVIDIA新的编码技术,不仅在画质方面,甚至是流畅性方面我们也看到了,是完全超过CPU编码的。所以为了让玩家有更好的直播性能发挥,我们更推荐使用全新的NVIDIA H.265硬件编码技术。
文章内容导航
- 第1页:直播编码的新选择
- 第2页:测试平台介绍
- 第3页:测试游戏及设置介绍
- 第4页:“虎牙直播”软件设置介绍
- 第5页:三种编码模式的流畅度及画质对比
- 第6页:帧数对比及总结