什麼是硬體加速GPU計劃?用處真的大嗎?實測驚訝

文章推薦指數: 80 %
投票人數:10人

迴歸正題,要說到GPU排程管理,我們就先要了解一下WDDM GPU排程器是什麼。

... 所以,“硬體加速GPU計劃”實質上是一項對Windows圖形架構影響較大的新 ... MdEditor 什麼是硬體加速GPU計劃?用處真的大嗎?實測驚訝 語言:CN/TW/HK 時間 2020-07-0412:45:34 快科技 主題: GPU 本文轉載自超能網,其他媒體轉載需經超能網同意。

在Windows10Version2004中,開發團隊給系統新增了一個名為“硬體加速GPU計劃”的選項,它隱藏在“顯示設定-圖形設定”中,作為一個實驗性的選項提供。

對於這個選項,微軟官方在之前並沒有做太多的解釋,我們也就是道聽途說認為它可以減低顯示延遲什麼什麼的。

在上個月末,終於有官方人員對這個選項進行了完整的解釋,本文就根據官方的這篇博文,講講這個全新的硬體加速GPU計劃選項的具體工作原理和作用,並整合了多家媒體的測試資料,看看它起的作用大小。

“硬體加速GPU計劃” 官方把Hardware-acceleratedGPUscheduling這個詞翻譯成了硬體加速GPU計劃,實際上在這裡scheduling翻成“排程”能夠讓更多人明白它的意思,這也是比較有微軟風味的翻譯了。

迴歸正題,要說到GPU排程管理,我們就先要了解一下WDDMGPU排程器是什麼。

WDDMGPU排程器與命令緩衝佇列 從NT6開始,微軟給Windows引入了一套新的顯示驅動模型,也就是我們現在所熟知的WindowsDisplayDriverModel,簡稱WDDM。

在WDDM出現之前,應用程式可以直接把任務提交到GPU,當時系統只有一個全域性的任務佇列,嚴格按照先到先執行的原則進行任務的排程。

鑑於當時用到GPU的場景基本上就是全屏遊戲或者專業用途的渲染什麼的,這種方案也沒出什麼問題,被沿用了很多年。

現在很多程式都會呼叫GPU 到了應用程式開始普遍利用GPU加速的年代,比如說Windows要直接用GPU加速整個UI介面的渲染了,那麼再用這個全域性任務佇列就會有問題,比如渲染系統介面的任務前面排了一個其他程式提交的任務,那麼GPU會先處理掉那個任務再回頭來處理系統的需求,這會造成整個系統UI的卡頓。

為了妥善地安排GPU工作的優先順序,勢必需要一個新的任務排程器,由它負責安排GPU任務的工作優先順序。

那麼WDDM就引入了那麼一個任務排程器,它以高優先順序執行緒的形式一直執行在CPU上,負責協調、優先處理和排程各種應用程式提交的工作。

從Vista上面的WDDM1.0到Windows10Version2004的WDDM2.7,官方一直都在加強這個排程器的功能。

但這種管理方式存在有一定的限制,主要體現在提交會有額外開銷和任務達到GPU有一定的延遲時間,不過這些限制在實際中都被傳統圖形應用的渲染緩衝佇列給掩蓋了。

緩衝用來存放提前準備好的渲染命令等等內容,在GPU渲染當前幀的時候,CPU已經在準備下一幀、下下幀乃至之後的更多幀數了。

這種方式能夠保證CPU與GPU之間的良好執行並行性,也可降低整體的效能開銷,是現在很常見的GPU呼叫方式。

同時為了降低頻率提交渲染命令帶來的額外效能開銷,一般應用程式會提前準備好多幀的內容一起傳送到佇列中。

這裡產生了問題,緩衝的幀數越多,使用者能夠感受到的延遲越高。

題外話,NVIDIA和AMD兩家在去年都已經在驅動層面提供了對緩衝佇列深度的控制,通過降低緩衝佇列的幀數來實現降低延遲這一目的。

但如果想減少緩衝佇列的深度來降低延遲,又會造成提交開銷增加,影響到效能。

這兩者之間是一個權衡關係,程式可能以更高的頻率每次提交更少的幀數來降低延遲,又可能以較低的頻率每次提交更多的幀數來減少額外的排程、提交開銷。

所以,微軟決定修改其顯示驅動模型的基礎架構,引入了“硬體加速GPU計劃”。

把任務排程交給專用硬體 Windows10Version2004中引入的新選項就是允許系統將絕大多數的排程任務交由GPU專有的硬體排程器去做,Windows將繼續控制程式呼叫GPU的優先順序,但高頻任務將會交由GPU的排程處理器進行管理,它負責各種GPU引擎的量子管理和上下文切換。

在NVIDIA的官方說法中,新的選項就是允許GPU直接管理它自有的記憶體,也就是視訊記憶體,在此之前,視訊記憶體是交給系統來管理的。

要啟用這個新排程方式有兩個先決條件,一個是需要硬體支援:它需要GPU自身有專有的處理排程任務的硬體模組,另一個是驅動支援:系統需要一個符合WDDM2.7標準的顯示驅動。

當你的驅動和硬體都支援時,系統設定裡才會出現這一選項。

另外,引入新的排程方式對驅動模型有一個重大且根本性的改變,在某些時候、某些場景下它可能會產生不可知的效果,因此微軟將其作為一個實驗性的選項,預設情況下是關閉掉的。

目前開發團隊還在比較兩種排程器之間的效能差異,同時也在監控新排程器的可靠性,未來這個選項可能會在支援的硬體上變為預設開啟狀態。

目前支援這一特性的GPU有NVIDIA的PascalGPU和TuringGPU、AMD的RDNAGPU,Intel那邊的情況不明。

實際測試:對高階平臺影響不大 好了,說了那麼多,我們還是來看看這項功能在實際中的表現吧,我們找來了Tom'sHardware和Wccftech兩家媒體的測試資料(以下圖片來自於Tom'sHardware和Wccftech)。

Tom'sHardware這邊使用了三套測試平臺,分別是Corei9-9900K+RTX2080Ti、Ryzen93900X+RTX2080Ti和Corei9-9900K+GTX1050。

從五款遊戲的測試結果來看,基本上沒有使用者可感知的區別。

Wccftech選擇了Corei9-9900K+RTX2080Ti/GTX1650SUPER這樣兩套平臺,在RTX2080Ti上面啟用硬體排程的效能變化並不明顯,但是在GTX1650SUPER這樣一張主流級顯示卡上面則是出現了明顯的提升。

其原因,如果按照NVIDIA方面的說法來解釋,那就是由GPU直接管理視訊記憶體在效率上帶來了一定的提升。

也許,這項功能會為很多主流級平臺帶來可觀的免費效能增幅,而對高階平臺來說,影響是微乎其微的。

總結:仍需時日完善的好技術 所以,“硬體加速GPU計劃”實質上是一項對Windows圖形架構影響較大的新技術,它需要新硬體和新驅動的支援才能夠實現,能夠為平臺帶來一定的效能提升。

但目前它仍然處於測試狀態,GPU廠對它的支援仍然算是剛剛可以用的狀態,還需要官方進一步的優化和完善它。

這也是微軟為次世代圖形應用對系統做出的改變,為了儘可能的降低延遲,讓系統跟上時代的發展。

它是一項好技術,但仍然還有很長的一段路要走。

折扣商品資訊>> 南極人充電式聲波電動牙刷券後價7.9元 聯想32gclass10高速記憶體儲卡券後價16.9元 一次性醫用外科口罩50只39.9元 一次性醫用口罩一片0.33元 決明子枸杞菊花茶卷後價9.9元 上帝天使之手起泡酒白葡萄酒(兩種口味)券後價39元 夏季薄款空調被券後價29.9元 90分全自動反向摺疊照明傘眾籌價49元 檢視原文 文章糾錯 微信公眾號搜尋"驅動之家"加關注,每日最新的手機、電腦、汽車、智慧硬體資訊可以讓你一手全掌握。

推薦關注!【微信掃描下圖可直接關注 】 「其他文章」 小米12家族新成員來了!小米12Lite曝光:螢幕比小米12更大 Windows11又發新版了:微軟解決工作管理員崩潰問題 油價大漲特斯拉車主紛紛晒好評:一個月才80元電費真香 特斯拉不轉賣承諾函被曝光律師發聲:侵犯車主權益、涉嫌違法 體驗太差風靡一時的紙吸管消失?你喝奶茶的吸管又變了 iOS15.4翻車:iPhone13更新續航暴降50%!蘋果火速回應 李想解讀新能源車漲價潮暗示理想ONE或跟進 150W秒充天璣8100旗艦!realmeGTNeo3官宣要用索尼IMX766主攝 WiFi6增強版路由器!RedmiAX5400新品預售:379元 Mac使用者需小心!曝最新MacOS系統升級可能導致“變磚” 曝寧德時代在北美建廠:價值超50億美元為特斯拉等車企供貨 天璣8100電競神機!realmeGTNeo3支援1000Hz智慧瞬時觸控 日本7.4級強震後:福島核電站85個核汙染水儲水罐發生位移、多處漏水 iPhone14Pro超清概念圖曝光:獨特挖孔屏、“土豪金”迴歸 USB-C資料線改名了!不提版本、只看速度 天璣8100獨顯晶片!realmeGTNeo3正面首度公佈:超窄邊框中孔屏 小米12Ultra樣機跑分曝光:三星工藝驍龍812GB記憶體 榮耀CEO趙明:榮耀不會造車歡迎吉利來做手機 華為首款1億畫素手機!華為nova9SE開售:2199元起 2年前的神機一加8系列升級至全新ColorOS12:再戰3年 「GPU」 Keras速查_CPU和GPU的mnist預測訓練_模型匯出_模型匯入再預測_匯出onnx並預測 訊息稱三星Xclipse920GPU基於AMDVanGoghLiteAPU設計 測試發現,蘋果M1Ultra核顯GPU相當於英偉達RTX3090獨顯的一半效能 計算機架構的新黃金時代,GPU能否繼續保持輝煌? 多年罕見!NVIDIA內部通知:GPU成本價降低8-15% 原價顯示卡真要來了?訊息稱英偉達悄悄通知AIC其GPU成本下降了8-12% 計算機架構的新黃金時代,GPU能否繼續保持輝煌? GPU能否在計算機架構新的黃金時代繼續保持輝煌? 訊息稱蘋果M2處理器6月登場:GPU大升級CPU要擠牙膏 單張GPU搞定GPT-3超引數!先訓練小模型,再“一鍵遷移”|已開源



請為這篇文章評分?