×

掃碼關(guān)注微信公眾號(hào)

對(duì)話英特爾院士Tom Petersen:持續(xù)優(yōu)化銳炫驅(qū)動(dòng),游戲性能強(qiáng)勁提升

2023/8/23 17:28:11      中關(guān)村在線

自去年英特爾發(fā)布銳炫顯卡以來,尤其是在進(jìn)入到今年之后,英特爾加快了銳炫顯卡驅(qū)動(dòng)的更新頻次,進(jìn)而使得銳炫顯卡在DX9、DX11游戲方面取得了顯著進(jìn)步。同時(shí)在DX12游戲方面,得益于架構(gòu)優(yōu)勢(shì),銳炫顯卡本身就有著良好的性能支持。

·DX11、DX9游戲體驗(yàn)大幅提升

根據(jù)英特爾新披露的數(shù)據(jù)來看,銳炫A750 8GB限量版顯卡在新驅(qū)動(dòng)加持,以及搭配英特爾13代酷睿i5-13400F處理器的情況下,相對(duì)于首發(fā)時(shí)的驅(qū)動(dòng)版本,1080P分辨率下DX11游戲性能已經(jīng)足足提升了19%,99%低幀流暢度提升了20%。了解硬件的朋友都知道,僅憑驅(qū)動(dòng)優(yōu)化就取得如此大幅度的提升并不容易,但是英特爾銳炫做到了。


image.png



image.png



image.png



image.png


截至目前為止,英特爾在今年已經(jīng)推出了多達(dá)十?dāng)?shù)個(gè)個(gè)大大小小的銳炫顯卡驅(qū)動(dòng),總計(jì)已經(jīng)推出了近30個(gè)驅(qū)動(dòng)版本的更新。

今年一季度,英特爾發(fā)布的針對(duì)DX9游戲大幅提升的驅(qū)動(dòng),促使平均性能提升約為43%,與此同時(shí),銳炫A750顯卡降價(jià)至249美元,整體性價(jià)比大幅提升。


image.png


以《CS:GO》、《英雄聯(lián)盟》等游戲?yàn)槔谑装骝?qū)動(dòng)3490和一季度發(fā)布的4086驅(qū)動(dòng)之間,DX9游戲體驗(yàn)的提升是極大的,高達(dá)到了77%,低也有10%的平均幀率提升,這使得英特爾銳炫顯卡在DX9游戲上的不足得到彌補(bǔ)。


image.png


今年二季度,英特爾進(jìn)一步深入研究了CPU與GPU的平衡問題,通過大量數(shù)據(jù)統(tǒng)計(jì),表明銳炫A750合適搭配的選擇是酷睿i5,隨后提供了大量?jī)?yōu)惠,加速了銳炫的推廣進(jìn)程。


image.png


在新發(fā)售游戲優(yōu)化方面,目前英特爾為57款新游戲提供了Day 0 Gameon的首日優(yōu)化支持,這意味著當(dāng)一款新的大型游戲發(fā)布時(shí),英特爾需要完成所有的優(yōu)化工作,并準(zhǔn)備好所有的驅(qū)動(dòng),進(jìn)而為玩家?guī)砀皿w驗(yàn)。


image.png


此外,Intel XeSS技術(shù)也在加快拓展游戲支持,目前原生支持XeSS技術(shù)的游戲已經(jīng)超過70款??赡芤仓挥杏⑻貭栠@樣擁有強(qiáng)大生態(tài)能力的公司,才能在短短一年不到的時(shí)間里達(dá)成如此多里程碑的吧。

·CPU與GPU的平衡關(guān)系

在一系列優(yōu)化驗(yàn)證過程中可以看到,英特爾提供的數(shù)據(jù)都是在銳炫A750與英特爾酷睿i5處理器基礎(chǔ)上進(jìn)行的測(cè)試,因?yàn)閿?shù)據(jù)顯示酷睿i5處理器是銳炫A750的佳平衡選擇,那么此時(shí)就會(huì)有一個(gè)問題產(chǎn)生:如果使用酷睿i9處理器去做相同測(cè)試會(huì)發(fā)生什么呢?

從下圖可以看到,對(duì)于酷睿i9處理器,新驅(qū)動(dòng)與初版驅(qū)動(dòng)之間的性能提升在9%到30%之間,雖然也是相當(dāng)大的提升,但比起酷睿i5高77%的提升顯然是要稍微遜色一些。


image.png


總體來說,酷睿i5平均性能提升在19%~20%,而酷睿i9約為12%,當(dāng)看到這組數(shù)據(jù)時(shí),是不是有悖于我們慣有的認(rèn)知呢?性能越強(qiáng)的處理器不是應(yīng)該提升更明顯嗎?


image.png


其實(shí)并非如此。當(dāng)你使用集成顯卡的時(shí)候,CPU因?yàn)樨?fù)載更大,所以CPU性能提升往往有著更高的收益比;而當(dāng)GPU性能足夠強(qiáng)時(shí),很多時(shí)候性能受限就轉(zhuǎn)移到了CPU上,因此驅(qū)動(dòng)程序需要重新架構(gòu),以減少每幀所需的CPU工作量,此時(shí)CPU的提升收益就完全不如GPU提升收益來的大了。

我們都知道,游戲每一個(gè)畫面幀都需要一定的渲染時(shí)間,也就是Frametime,幀生成時(shí)間。下圖是英特爾官方給出的渲染流程示意圖,簡(jiǎn)單來說就是游戲每一幀開始時(shí)會(huì)執(zhí)行一系列邏輯,隨后進(jìn)行物理計(jì)算,進(jìn)行命中檢測(cè),將目標(biāo)移動(dòng)到新的位置,可能會(huì)繪制新的幾何圖形等,之后會(huì)進(jìn)入渲染過程。


image.png


在計(jì)算完游戲狀態(tài)之后,它會(huì)將所有的游戲狀態(tài)傳遞給一個(gè)渲染器,然后渲染器將從游戲狀態(tài)轉(zhuǎn)換為DirectX調(diào)用并進(jìn)行傳遞,之后會(huì)執(zhí)行名為Present”的操作,它是一個(gè)DX命令,當(dāng)被調(diào)用時(shí),就意味著已經(jīng)將所有圖形信息都發(fā)送給了DirectX,它現(xiàn)在可以渲染一幀,CPU隨之進(jìn)入等待狀態(tài),等待“Present”返回之后,進(jìn)入下一個(gè)循環(huán),也就是開始等待渲染新的一幀。

·什么是GPU Busy?

為了搞清楚從一幀的“Present”到下一個(gè)幀的“Present”之間的時(shí)間間隔,也為了搞清楚CPU與GPU之間在這些階段的平衡關(guān)系,英特爾引入了一個(gè)新的衡量指標(biāo):GPU Busy。通過GPU Busy指標(biāo),用戶可以了解到GPU使用多少時(shí)間進(jìn)行實(shí)際渲染,多少時(shí)間是空閑等待狀態(tài)。同時(shí)可以了解游戲運(yùn)行時(shí),CPU與GPU工作是否處于平衡狀態(tài),是彼此之間高效協(xié)同工作,還是互相閑置互扯后腿。


image.png


因此,GPU Busy可以幫助玩家更加清晰直觀地了解到自己的CPU與GPU是否匹配,二者時(shí)間是否存在一些瓶頸,同時(shí)還能夠分析出游戲分辨率、畫質(zhì)設(shè)定是否合適,以便做出更有對(duì)策性地調(diào)整。

英特爾院士Tom Petersen表示,“GPUBusy會(huì)因游戲而異。在設(shè)置中,一般來說,在運(yùn)行更多的GPU密集型活動(dòng)時(shí),GPU Busy的程度會(huì)更高,當(dāng)較少時(shí),它會(huì)更低,并且大多數(shù)情況下可以很容易通過更改分辨率體現(xiàn)出來?!?/p>

比如以1080P分辨率、Ultra畫質(zhì)下的《守望先鋒2》測(cè)試為例,銳炫A750顯卡在搭配酷睿i5處理器時(shí),在首發(fā)3490驅(qū)動(dòng)版本下以及在后續(xù)4571版本下,GPU Busy(黃色)與幀生成時(shí)間(藍(lán)色)之間的狀態(tài)有著非常顯著的差異。


image.png



image.png


在使用4571驅(qū)動(dòng)時(shí),GPU Busy與幀生成時(shí)間幾乎處于完全同步的狀態(tài),這意味著CPU與GPU在絕大部分時(shí)間都能夠高效協(xié)同工作,不會(huì)出現(xiàn)明顯的空閑等待期,因此在效率上獲得顯著提升。

GPU Busy這項(xiàng)指標(biāo)也能夠衡量出游戲在不同畫質(zhì)時(shí)的GPU Busy與幀生成時(shí)間之間的狀態(tài)。如下面兩張圖所示,在《反恐精英2》這款游戲中,同樣配置、同為4571驅(qū)動(dòng)的情況下,1080P分辨率低畫質(zhì)和Ultra畫質(zhì)時(shí)的曲線狀態(tài)差異非常明顯。如果作為玩家看到這樣的GPU Busy指標(biāo)狀態(tài),那么就會(huì)明白,這款游戲在當(dāng)前配置下合適的畫質(zhì)設(shè)定就是“Ultra”,而非“Low”。


image.png



image.png


可見,在引入GPU Busy指標(biāo)之后,如果玩家特別在于CPU與GPU的工作效率,亦或者說想要獲得佳游戲體驗(yàn),就能夠更加針對(duì)性地去選擇硬件搭配和游戲設(shè)定了。

·通過PresentMon Beta更好地了解GPU Busy

那么我們?nèi)绾尾拍軌驕y(cè)量出自己電腦的GPU Busy指標(biāo)呢?為此,英特爾推出了PresentMon Beta測(cè)試工具。它是為終端用戶和媒體提供的工具,可以使GPU Busy與幀生成時(shí)間之間的平衡關(guān)系變得可視化。它同時(shí)兼容N卡和A卡,支持DirectX11、12、OpenGL、Vulkan等API。


image.png


如下圖所示,PresentMon提供了全新的疊加視圖功能,在游戲時(shí)可以實(shí)時(shí)監(jiān)測(cè)各項(xiàng)性能數(shù)據(jù),如GPU Busy指標(biāo)、游戲?qū)崟r(shí)幀率、GPU占用率、溫度等信息,還能夠監(jiān)測(cè)99%低幀狀態(tài)等。


image.png


PresentMon可由用戶進(jìn)行界面顯示參數(shù)的自定義,調(diào)整顯示效果等等,它包含了大約30種不同的參數(shù)可以監(jiān)控,用戶可以將其設(shè)置為數(shù)字文本或圖形圖表模式,同時(shí)它也支持直方圖,通過不同的UI形式讓用戶更加了解自己電腦游戲時(shí)的狀態(tài)。


image.png



image.png


image.png


其實(shí)在筆者看來,如果英特爾能夠把PresentMon集成到Arc Control控制面板里會(huì)更加方便。但根據(jù)Tom Petersen的介紹來看,PresentMon其實(shí)本身也是一個(gè)軟件的集合,因此它涵蓋了一些底層SDK,以便為高級(jí)別的軟件提供服務(wù)。隨著后續(xù)版本更新,Arc Control可能會(huì)逐步開始利用PresentMon服務(wù),但目前還無法實(shí)現(xiàn)。因此現(xiàn)階段英特爾首先是將可PresentMon的各項(xiàng)功能加以完善,讓它能更加獨(dú)立地運(yùn)行。此外考慮到PresentMon可以兼容N卡、A卡,因此現(xiàn)階段作為獨(dú)立軟件去使用會(huì)更符合自身定位。

·結(jié)語

自去年10月發(fā)布銳炫GPU以來,英特爾在短時(shí)間內(nèi)大幅優(yōu)化了DX9游戲體驗(yàn),并且重新設(shè)計(jì)了DX11驅(qū)動(dòng),帶來了高達(dá)19%左右的游戲性能提升以及大約20%的99百分位提升。

此外,英特爾全新引入GPU Busy指標(biāo)去衡量游戲過程中CPU與GPU之間的平衡關(guān)系,并且可以幫助用戶通過更改游戲畫質(zhì)設(shè)定、分辨率設(shè)定等來提升硬件效率。同時(shí),英特爾推出全新的Intel PresentMon Beta測(cè)試工具,終端用戶可以自由下載,并通過它來監(jiān)測(cè)電腦狀態(tài),了解自己電腦的GPU Busy指標(biāo)。