1新旗艦讓泰坦跌落神壇
今年被很多人認為是VR元年,醞釀了多年的VR終于呈現(xiàn)出井噴式增長;今年同樣是GPU的爆發(fā)之年,時隔5年,28nm的GPU終于退出歷史舞臺,全新的14/16nm制程開始大放光彩。隨著NVIDIA Pascal架構(gòu)和AMD Polaris顯卡的大幅度曝光,GPU界仿佛過年一樣熱鬧,每天都有新消息,每周都有新曝光,真假莫辨的傳言點燃了DIY玩家心中追求更快更強顯卡的激情。終于,2016年5月7日,NVIDIA博得先機,率先發(fā)布了全球首款16nm游戲顯卡——GeForce GTX 1080/1070,正如老黃所說:“A New King”誕生,至此,GPU界展開了全新的篇章,1x nm級的AN顯卡大戰(zhàn)一觸即發(fā)。
NVIDIA GeForce GTX 1080產(chǎn)品綜述|圖片(1)|參數(shù)|報價|點評本地參考底價 5399.00元
在NVIDIA Editor's Day的發(fā)布會上,老黃自信地宣稱:“GeForce GTX 1080比GTX Titan X還快,甚至比雙路GTX 980 SLI還快!其VR性能是GTX Titan X的2倍,能耗比是GTX Titan X的3倍!”說完這席話,臺下爆發(fā)出雷鳴般的掌聲和歡呼聲,作為Pascal架構(gòu)的首發(fā)先鋒,GTX 1080竟做到了戰(zhàn)勝上代Maxwell架構(gòu)的所有卡,不得不讓人感嘆,新時代終于來了,GTX 1080締造了全新的性能神話。

GeForce GTX 1080
老黃在會上展示了一張GTX 1080運行游戲時的幀數(shù)對比圖,對比的對象是GTX 980,通過柱狀圖可以看出GTX 1080在游戲中的表現(xiàn)大約是GTX 980的1.7倍。就在昨天,筆者參加NVIDIA的媒體技術(shù)講解會,會上證實,GTX 1080的游戲性能的確是GTX 980的1.7倍,VR性能是GTX 980的2.7倍。如果算上SLI的效率,GTX 1080的確如老黃所說,比GTX 980雙路SLI要強一點,而根據(jù)推算,GTX 1080應(yīng)該比GTX Titan X2強25-30%,這樣一看,提升的確很大。

GeForce GTX 1080
不過這些都是根據(jù)NVIDIA自己的跑分以及會議上的說明得出的結(jié)論,實際性能如何需要我們親自去證明。就在前不久,我們拿到了NVIDIA的公版GeForce GTX 1080,也就是老黃會上所稱的“Founders Edition”,同時,我們也得到了NVIDIA提供的測試驅(qū)動368.14,該驅(qū)動正是老黃在發(fā)布會上進行演示時所用的驅(qū)動。是時候揭曉GTX 1080的神秘面紗了,究竟它是否能夠如我們所期待和推測的那樣強悍,我們會用軟件和游戲一一去證明,來和我們一起,去見證泰坦的隕落,新一代卡皇的真容吧!

點擊圖片圍觀全球首臺GTX1080水冷主機
2似是故人的新架構(gòu)
似是故人的新架構(gòu)
GeForce GTX 1080采用了兩年前就已在GTC上被老黃透漏的全新架構(gòu)——Pascal,“Pascal”依然取自一位著名物理學(xué)家的名字,國際單位制中壓力的單位“Pa”即以其姓氏命名。Pascal架構(gòu)的第一款產(chǎn)品是4月初發(fā)布的Tesla P100,其采用GP100大核心,而這次發(fā)布的GTX 1080則是采用GP104核心,具體型號為GP104-400,次旗艦GTX 1070為GP104-200。GP104核心面積約為314平方毫米,得益于16nm的制程優(yōu)勢,核心內(nèi)集成了72億晶體管,是GTX 980晶體管數(shù)量的1.38倍,核心面積卻僅為GTX 980的78.9%。

NVIDIA GP104-400核心
基于Pascal架構(gòu)的GM204-400芯片運算資源總量為2560個ALU,TFU數(shù)量為160個,后端的ROPs數(shù)量為64個,四個帶寬為64bit的雙通道顯存控制器組成了總量為256bit的顯存控制單元,大小為8GB。同GTX 980相比,其各項參數(shù)均有所提升,尤其是顯存帶寬達到了320GB/s,這是因為其率先采用了GDDR5X顯存,GDDR5X顯存的改進使得GTX 1080在位寬相同的情況下?lián)碛懈叩膸,初期即可達到10-12Gbps,而隨著進一步的研發(fā)最高能夠提升到16Gbps。
顯 卡 規(guī) 格 比 較 表 |
顯卡型號 |
GTX 1080 |
R9 Fury X |
GTX 980 |
GTX Titan X |
首發(fā)限價 |
\$599 |
\$649 |
\$549 |
\$999 |
GPU代號 |
GP104 |
Fiji XT |
GM204 |
GM200 |
GPU工藝 |
16nm |
28nm |
28nm |
28nm |
GPU晶體管 |
7.2B |
8.9B |
5.2B |
8B |
著色器數(shù)量 |
2560 |
4096 |
2048 |
3072 |
單精度浮點 |
9 T |
8.6 T |
5 T |
7 T |
ROPs數(shù)量 |
64 |
64 |
64 |
96 |
紋理單元數(shù)量 |
160 |
256 |
128 |
192 |
核心頻率 |
1607MHz |
1050MHz |
1126MHz |
1000MHz |
boost頻率 |
1733MHz |
1050MHz |
1216MHz |
1075MHz |
架構(gòu) |
Pascal |
GCN |
Maxwell |
Maxwell |
顯存頻率 |
2500 MHz |
500 MHz |
1753 MHz |
1753 MHz |
內(nèi)存位寬 |
256 bit |
4096 bit |
256 bit |
384 bit |
內(nèi)存帶寬 |
320 GB/s |
512 GB/s |
224 GB/s |
336 GB/s |
內(nèi)存類型 |
GDDR5X |
HBM |
GDDR5 |
GDDR5 |
內(nèi)存容量 |
8 GB |
4 GB |
4 GB |
12 GB |
注:表中售價均為官方首發(fā)限價
我們可以看到GeForce GTX 1080的默認核心頻率達到了驚人的1607MHz,Boost頻率為1733MHz,顯存帶寬為320GB/s,這款產(chǎn)品完整支持DirectX 12 API以及異步運算,在DX12中有著更好的表現(xiàn)。GTX 1080的默認Pixel Fillrate能力達到了102.8Gpiexls/S,默認Texture Fillrate能力為277.3Gtexels/S。憑借超高的基礎(chǔ)頻率和龐大的運算規(guī)模,GTX 1080擁有9 TFLOPS的超高單精度浮點運算能力,照比GTX Titan X提升了28%,甚至超越了R9 Fury X的8.6 TFLOPS單精度浮點運算能力,成為目前單精度浮點運算性能最高的游戲顯卡。

GP104架構(gòu)圖
Pascal架構(gòu)GP104-400芯片由以下主要的部分組成:
1、基于TSMC的16nm FinFET工藝。
2、4單元的宏觀并行結(jié)構(gòu),20組SMs單元被分為4個GPC,每個GPC包含5組SMs。
3、20組全新設(shè)計的,包含了幾何引擎、光柵化引擎以及線程仲裁管理機制的SMs單元。每個SMs單元包含一組負責(zé)處理幾何任務(wù)需求的PolyMorph Engine,同時均下轄5組更基本的SM單元,每個SMs單元包含8個負責(zé)處理材質(zhì)以及特種運算任務(wù)如卷積、快速傅里葉變換等的Texture Array,四組并行的二級線程管理機制以及對應(yīng)的shared+Unified Cache等緩沖體系。
4、GP 104擁有8個32位顯存控制器,總計256位,每個32位顯存控制器包含8個ROPs單元和256KB二級緩存,共計64個ROPs單元和2M二級緩存。
5、改進型的4.0版本PolyMorph Engine,包含了為VR設(shè)計的The Simultaneous Multi-Projection Engine,在極端情況下,SMP引擎可以減少32倍VR所需的幾何渲染工作量。

GP104 SM單元架構(gòu)圖
在GeForce GTX 1080上,我們看到了其與上代基于Maxwell 2.0架構(gòu)顯卡相類似的設(shè)計,主要區(qū)別就是每個GPC中多了一組SMs單元。這就讓這款顯卡能夠支持所有在GeForce GTX 900系列中的特性,以后使用到這款顯卡的玩家能夠獲得與其他采用基于Maxwell 2.0架構(gòu)設(shè)計的顯卡的體驗。
3初次見面,GDDR5X顯存
初次見面,GDDR5X顯存
HBM顯存已經(jīng)成為新一代高端顯卡的標(biāo)準(zhǔn)之一,而且此前JEDEC也正式公布了JESD235A的技術(shù)規(guī)范標(biāo)準(zhǔn),帶來了TB/s級帶寬、16/32GB超大容量的HBM2顯存。不過HBM的問題在于顯存成本依然很高,不可能短時間內(nèi)應(yīng)用在全部顯卡上,因此GeForce GTX 1080使用了良品率更高,成本更低的GDDR5顯存的升級版——GDDR5X顯存。

GTX 1080上使用的GDDR5X顯存
GDDR5X則可以簡單理解為在GDDR5技術(shù)基礎(chǔ)上的一個拓展,其選擇采用雙管齊下的方式來提升顯存帶寬。首先,它的總線從DDR(雙倍數(shù)據(jù)倍率)升級到了QDR(四倍數(shù)據(jù)倍率)。

SDR、DDR及QDR的對比關(guān)系
需要說明的是,SDR(單倍數(shù)據(jù)倍率)即只利用時鐘信號的上沿來傳輸數(shù)據(jù);而DDR(雙倍數(shù)據(jù)倍率)則同時利用了時鐘信號的上沿和下沿來傳輸數(shù)據(jù),這意味著系統(tǒng)可以在同樣的時間內(nèi)、同一時鐘頻率下將傳輸數(shù)據(jù)的速率提升一倍;而QDR(四倍數(shù)據(jù)倍率)則在DDR的基礎(chǔ)上,進一步提供獨立的寫入接口和讀取接口,以此達到四倍之于SDR的數(shù)據(jù)傳輸速率。

GDDR5X顯存顆粒
同時,GDDR5X還簡單粗暴的將數(shù)據(jù)預(yù)取位寬從8-Bit提升到了16-Bit,從而得到更高的帶寬,初期即可達到10-12Gbps,而隨著進一步的研發(fā)最高能夠提升到16Gbps。相比之下,GDDR5現(xiàn)在最高也才7Gbps,超頻到極限約為8Gbps。傳輸速率的提升再加上顯存位寬的提升,相當(dāng)于在提高車速的基礎(chǔ)上又拓寬了車道數(shù)量,因此GDDR5X可以得到GDDR5兩倍的帶寬。

GDDR5X顯存特性
雖然從本質(zhì)上說,GDDR5X同GDDR5相比沒有什么區(qū)別,但大幅提升的頻率還是帶來了可觀的帶寬提升。在HBM2顯存良率達標(biāo)之前,至少在最近的一段時間內(nèi),NVIDIA和AMD必然還是以GDDR5X顯存為主。此外,鎂光已經(jīng)宣稱GDDR5X顯存量產(chǎn),這就給使用GDDR5X顯存的GTX 1080的產(chǎn)能有了一個保證,而AMD的全新Polaris顯卡應(yīng)該也會用上GDDR5X顯存。
4顯卡全新技術(shù)解析
Simultaneous Multi-Projection技術(shù)
面對即將大爆發(fā)的VR市場,NVIDIA顯然要讓GPU承擔(dān)起更多任務(wù),來協(xié)助建立VR生態(tài)圈。在GeForce GTX 1080/1070的發(fā)布會上,NVIDIA為旗下VR SDK——VRworks添加了新的內(nèi)容。首先是Simultaneous Multi-Projection技術(shù),該技術(shù)直譯為“同步多重投射”。

老黃講解Simultaneous Multi-Projection技術(shù)
經(jīng)常組多聯(lián)屏的玩家一定知道,當(dāng)屏幕組成一個小于180°的夾角,也就是兩塊顯示器之間形成角度的時候,顯卡渲染場景一直有個很難糾正的扭曲現(xiàn)象,就是看上去渲染的圖形依然看上去是一個180°平面的圖形,卻被硬生生地被放在兩塊形成夾角的顯示器上,看上去根本沒有任何的扭曲和形變。換句話說,雖然顯示端已經(jīng)是曲面屏了,但是畫面還是180°的平面,比如左邊這幅圖:

Simultaneous Multi-Projection技術(shù)示意
可以看到對于右邊的部分GPU還是基于一個180°的平面渲染的,問題在于我們的顯示器擺放是有角度的,并且呈一個弧形,但是GPU并不知道顯示器之間的夾角會影響輸出的圖形,它只是機械的渲染,所以右邊這部分場景其實是渲染錯誤的,正確的輸出應(yīng)該是如右圖這個樣子。Simultaneous Multi-Projection技術(shù)可以根據(jù)顯示器之間的角度,在生成圖像的同時動態(tài)調(diào)整圖像,將渲染的場景按照一定的角度生成,也就是讓生成的圖像保持有角度的渲染,而不只是機械地生成一張平面,換句話說,可以將本身是平面的畫面曲面化以貼合曲面的屏幕。
除了解決了這個尷尬角度的問題,Simultaneous Multi-Projection還針對VR渲染進行了特別的優(yōu)化,并且引入了新的Single Pass Stereo技術(shù),Single Pass Stereo可有效減少傳統(tǒng)VR渲染一半的工作量,上圖所示的這個場景,啟用Single Pass Stereo后幀率從60~70幀增加到90多幀,提升幅度超過30%,而90幀正是VR游戲的最低要求。

Single Pass Stereo技術(shù)
VRWorks Audio技術(shù)
VR主要是通過視覺來讓用戶擁有身臨其境的體驗,然而光有視覺是不夠的,想要獲得足夠的沉浸感,聽覺也是十分重要的一環(huán)。在會上,NVIDIA展示了一項有關(guān)VR聽覺的加強技術(shù),名為VRWorks Audio,該技術(shù)是全球首款實時物理模型的聲學(xué)仿真技術(shù)。

老黃講解VRWorks Audio(圖片來自BenchLife)
有物理基礎(chǔ)的空間或3D音效,即虛擬場景內(nèi)產(chǎn)生的音效,在到達用戶虛擬的耳朵之前會受到一定的影響,這一過程后才產(chǎn)生的。影響的因素可能包括:由于墻壁或門的封閉,使聲音呈現(xiàn)的靜音狀態(tài);或者聲音在經(jīng)過多個物理表明反射后產(chǎn)生的回音等。

《VR Funhouse》demo
NVIDIA提到,他們在做音頻模型或渲染的過程很像光線追蹤的過程,光線追蹤對處理器要求很高,但在渲染圖像上及其精確,它能夠計算出一個場景中從來源到目的地這一路徑上的每一束光線。NVIDIA宣稱可以追蹤聲波在虛擬場景內(nèi)的路徑,并將根據(jù)扭曲的聲波來應(yīng)用到其“物理”能力和經(jīng)過渲染的音頻上。事實上,VRWorks Audio使用了NVIDIA現(xiàn)有的光線追蹤引擎OptiX來模擬在某一個環(huán)境內(nèi)的聲音運動或其傳播軌跡,同時根據(jù)你所處的虛擬世界的大小、形狀和環(huán)境材質(zhì)來實時改變該聲音。
Ansel截圖技術(shù)
NVIDIA發(fā)布了一個全新的截圖工具,工具的名稱叫做Ansel,該名稱是為了紀(jì)念偉大的攝影師Ansel Adams。說起這個攝影師,它還是很有名氣的,是自然風(fēng)光攝影殿堂級人物,還曾獲得美國公民的最高褒獎——總統(tǒng)自由勛章。以Ansel的名字來命名新的截圖軟件,一來是為了紀(jì)念這位大師,二來是為了表明,截圖也可以是一種藝術(shù)。

Ansel截圖技術(shù)
憑借Ansel,游戲玩家能夠合成自己喜歡的游戲畫面,可以在游戲世界中的任何有利位置將鏡頭指向任意方向。游戲玩家最高能夠以32倍的屏幕分辨率捕捉屏幕截圖,然后即可在截圖上選擇某個位置放大顯示并做到不失真。憑借照片過濾器,游戲玩家可以實時添加特效,然后截取完美的照片。游戲玩家可以捕捉360度立體光球圖像,以便在虛擬現(xiàn)實頭戴式顯示器或谷歌Cardboard中進行觀看。

老黃講解Ansel
沒聽懂?通俗點講,就是你可以在游戲中截取一個超大的截圖,這個截圖是360°環(huán)繞式的,這個截圖包含了所有角度和位置信息,你可以在任意一點觀看在該點的游戲圖像。截好了圖你就可以在VR眼鏡中查看了,看到的效果就如同身處在游戲中。聽起來很酷炫是不是?這個截圖不僅能體現(xiàn)在VR顯示器上,還能通過APP傳遞給手機,通過手機也能直觀的感受到這張游戲截圖的震撼性。并且這項技術(shù)并非空談,《全境封鎖》、《見證者》、《巫師3》、《無人深空》、《虛幻競技場2014》在現(xiàn)場都宣布將支持Ansel技術(shù)。

已經(jīng)有許多大作宣布支持Ansel
5顯卡改進技術(shù)解析
第四代delta色彩壓縮技術(shù)
顯存壓縮技術(shù)對于提高顯卡性能是很有幫助的。同之前的NVIDIA GPU一樣,全新的GTX 1080也采用了這樣一種無損壓縮技術(shù)。這種技術(shù)有以下幾點好處:減少顯存數(shù)據(jù)寫入量;減少數(shù)據(jù)從顯存到GPU二級緩存的數(shù)據(jù)傳輸量,有效增加了GPU二級緩存的容量以及降低紋理單元和幀緩存間的數(shù)據(jù)傳輸量。

第四代delta色彩壓縮技術(shù)
顯存壓縮技術(shù)中最重要的一種就是“delta色彩壓縮技術(shù)”,這種技術(shù)讓GPU計算每一個塊中像素的差異,然后將相同色彩的像素信息進行壓縮,在極端狀況下,壓縮儲存后的參考像素還不及未經(jīng)壓縮像素一半的大小,這無疑大大減小了數(shù)據(jù)傳輸量。

GTX 1080有效帶寬可達GTX 980的1.7倍
GTX 1080搭載了全新的增強型delta色彩壓縮技術(shù),可以更高效地實現(xiàn)2:1的壓縮比,同時,全新的4:1、8:1高壓縮比模式也已被GTX 1080所采用,這使得顯存利用率再次達到一個新高度,相當(dāng)于等效提升了對應(yīng)比例的顯存帶寬。第四代delta色彩壓縮技術(shù)同上代相比能夠減少20%的有效帶寬,再配合上GTX 1080率先使用的10Gbps速率的GDDR5X顯存,最終使得其有效顯存帶寬是上代GTX 980的1.7倍。
異步運算技術(shù)
從傳統(tǒng)角度上看,GPU主要承擔(dān)的任務(wù)是圖形渲染,系統(tǒng)會將待處理的工作按照指定流程傳遞給GPU,以便讓圖像能夠以正確的順序顯示出來,這點對于圖形渲染來說非常重要。而現(xiàn)如今隨著GPU功能的不斷挖掘以及架構(gòu)的不斷升級,許多計算、復(fù)制的工作也會交由GPU來做,如果仍然只有一條序列的話,渲染、計算、復(fù)制三項任務(wù)將會互相搶占,造成“交通擁堵”,運行效率自然大打折扣。因此多條序列分別處理渲染、計算、復(fù)制等工作才能大大提升GPU效率,這種技術(shù)就是異步運算技術(shù)。
說起異步運算技術(shù),大家可能會首先想到AMD的GCN架構(gòu),GCN的異步著色器技術(shù)讓GCN架構(gòu)的A卡在DX12中擁有了出色的性能表現(xiàn)。隨著DX12時代的全面到來,NVIDIA的全新GTX 1080自然也是在異步運算上狠下功夫。官方宣稱,GTX 1080有著完全的異構(gòu)計算能力,借助異構(gòu)著色器,GPU可以并行處理多任務(wù),而非按優(yōu)先級進行候選或者搶占。

動態(tài)負載平衡技術(shù)
首先為大家介紹的是Pascal架構(gòu)引入的全新技術(shù)——動態(tài)負載平衡。為了讓大家能夠更直觀地了解這項技術(shù),我們看上面這張圖:橫坐標(biāo)是時間,縱坐標(biāo)是GPU資源分配百分比,淺綠色是圖形工作量,深綠色部分是計算工作量,而灰色斜紋部分為空閑。首先看上半部分的靜態(tài)平衡,如果計算工作量所需的時間比圖形工作量的時間長,而兩個工作需要同時完成才能進行新的工作,那么進行圖形工作的GPU就會有一部分閑置出來,這就浪費了GPU的性能;接著我們看下圖的動態(tài)平衡,當(dāng)計算工作量先完成時,負責(zé)計算工作的GPU資源就會去幫助完成剩余的圖形工作,這樣就不會有閑置的GPU資源,并且大大降低了工作所需的時間,這就是Pascal的動態(tài)負載平衡技術(shù)。

Pascal架構(gòu)的搶占技術(shù)
然后是有關(guān)GPU搶占的技術(shù)。了解VR的朋友們一定聽說過“異步時間扭曲”技術(shù),異步時間扭曲是指在一個線程(稱為ATW線程)中進行處理,這個線程和渲染線程平行運行(異步),在每次同步之前,ATW線程根據(jù)渲染線程的最后一幀生成一個新的幀。(有關(guān)異步時間扭曲的知識請參見《小菜硬件雜談 說說VR里的異步時間扭曲》)實現(xiàn)異步時間扭曲需要GPU支持合理的搶占粒度,那么搶占指的是什么意思呢?所謂搶占,就是指為了使重要工作得以快速運行,GPU會選擇性關(guān)閉不太重要的工作,從而提高重要工作的運行效率。Pascal架構(gòu)是史上首個支持像素級搶占的GPU架構(gòu),當(dāng)接收搶占請求時,Pascal的圖形單元會記錄下那些優(yōu)先級較低的工作被中斷時的位置,優(yōu)先處理那些重要的工作;當(dāng)搶占結(jié)束后,其余的工作從之前被中斷的位置開始繼續(xù)執(zhí)行。

搶占在VR中的應(yīng)用——異步時間扭曲(ATW)技術(shù)
Pascal的搶占不僅作用于圖形工作中,在計算工作中也可以實現(xiàn)。線程級的搶占和像素級搶占的實現(xiàn)方式類似,都是停下當(dāng)前優(yōu)先級較低的線程塊的工作,去支援優(yōu)先級較高的SMs運算線程,當(dāng)搶占結(jié)束后,從之前中斷的地方開始繼續(xù)計算工作。對于游戲來說,像素級搶占和線程級搶占相結(jié)合讓Pascal架構(gòu)GPU可以以極快的速度和最小的性能開銷實現(xiàn)搶占,同時對于CUDA計算任務(wù),Pascal也可以以最好的搶占粒度去實現(xiàn)搶占。
Fast Sync技術(shù)
Fast Sync是一種替代傳統(tǒng)垂直同步的防止畫面撕裂的技術(shù)。同V-Sync不同的是,開啟Fast Sync后,在做到防止畫面撕裂的同時能夠不降低顯卡的性能,也就是說Fast Sync能夠?qū)崿F(xiàn)V-Sync開啟時的流暢畫面,并且有著如同未開啟V-Sync一樣的低延遲。從下圖可以看出,F(xiàn)ast Sync的延遲僅比關(guān)閉V-Sync時的延遲多了8ms,這點差距還是十分令人滿意的。最后,F(xiàn)ast Sync技術(shù)可以搭配G-Sync技術(shù)一起使用,為玩家?guī)砀玫囊曈X效果。

Fast Sync和V-Sync延遲對比
全新高帶寬橋接器
同GTX 1080問世的還有NVIDIA全新設(shè)計的SLI橋接器。使用傳統(tǒng)的橋接器進行雙卡互聯(lián)時只需要連接每張卡上的一根SLI金手指即可,而這種全新的橋接器需要同時連接GTX 1080上的兩根SLI金手指,以提高GPU之間的數(shù)據(jù)傳輸帶寬。這個全新的SLI橋接器叫做“New SLI HB Bridge”,使用這個全新的橋接器時,GTX 1080的SLI接口運行在650MHz,而傳統(tǒng)的橋接器搭配之前的GPU只能運行在400MHz。

New SLI HB Bridge
GTX 1080的全新SLI系統(tǒng)能夠提供上代GPU SLI系統(tǒng)2倍的帶寬,這對于4K或5K這樣的高分辨率及環(huán)繞輸出尤為重要。而且全新的橋接器可以實現(xiàn)更平滑的畫面輸出,在游戲中能夠為玩家?guī)砀槙车挠螒蝮w驗。不過遺憾的是,由于全新的橋接器需要使用兩根SLI金手指才能工作,因此使用New SLI HB Bridge的GTX 1080只能實現(xiàn)雙卡SLI。
GPU Boost 3.0
GPU Boost是NVIDIA推出的GPU動態(tài)提速技術(shù),能夠在TDP允許的范圍內(nèi),盡可能地提高GPU運行頻率,進而提升GPU工作效率。全新的GTX 1080為我們帶來了這個技術(shù)的最新升級版——GPU Boost 3.0。GPU Boost 3.0可以設(shè)置各個電壓點的頻率偏移。GPU Boost 2.0及以前的版本只能實現(xiàn)固定的頻率偏移,也就是說頻率的提升只能呈線性的方式,提升后的頻率無法達到此電壓下對應(yīng)的最大頻率。

GPU Boost 2.0與3.0之間的區(qū)別
GPU Boost 3.0就很好地解決了這個問題,頻率偏移可以對應(yīng)到單個電壓點,而不是像之前的線性相關(guān),這樣就可以使得GPU的頻率達到該電壓下所能實現(xiàn)的最大值,大大提升了GPU Boost的效果。全新的GPU Boost 3.0還能與超頻軟件相結(jié)合,讓玩家可以手動調(diào)整頻率偏移曲線,來達到理想的GPU頻率。
6顯卡拆解賞析
顯卡拆解賞析
首先我們來看一下GeForce GTX 1080的拆解賞析:

顯卡正面

均熱板及渦輪扇

顯卡散熱器

散熱器背面

顯卡背板

顯卡信仰燈

顯卡PCB

顯卡核心

輔助供電接口

視頻接口

Founders Edition包裝盒
接下來我們看一下同GeForce GTX 980的對比拆解,圖中上方為GeForce GTX 1080,下方為GeForce GTX 980:

顯卡正面對比

顯卡背面對比

顯卡側(cè)面對比

散熱模塊對比

PCB正面對比

PCB背面對比

供電接口對比
同GTX 980相比,GTX 1080的有以下幾點設(shè)計上的改進:散熱器經(jīng)過全新的設(shè)計,這點已經(jīng)無需贅言;供電由4+1相升級為5+1相,輔助供電接口由雙6pin變?yōu)閱?pin,為濾波網(wǎng)絡(luò)增添了額外的電容,優(yōu)化供電網(wǎng)絡(luò);最后,背板經(jīng)過全新的設(shè)計,分為兩段式,在SLI時,可以卸下后半部分的背板,以防止背板對氣流的干擾。
7測試平臺環(huán)境一覽
測試平臺硬件環(huán)境一覽
為保證測試能夠發(fā)揮顯卡的最佳性能,本次測試平臺采用最強酷睿芯——Intel酷睿i7-5960X處理器、技嘉X99芯片組主板、影馳 Gamer DDR4-2400 8GB 四通道內(nèi)存、安鈦克1200w金牌電源組建而成。詳細硬件規(guī)格如下表所示:
測 試 平 臺 軟 硬 件 配 置 |
核心配件 |
CPU |
Intel |
酷睿i7-5960X |
主板 |
技嘉 |
GA-X99-Gaming G1 WIFI |
核芯顯卡 |
無 |
無 |
內(nèi)存 |
影馳 |
Gamer DDR4-2400 8GB x4 |
硬盤 |
浦科特 |
PX-512M6S+ |
電源 |
安鈦克 |
HPC-1200 |
系統(tǒng)及驅(qū)動程序 |
操作系統(tǒng) |
Microsoft Windows 10 |
主板驅(qū)動 |
Intel芯片組驅(qū)動 |
顯卡驅(qū)動 |
NVIDIA GeForce Game Ready Driver(368.39 WHQL) |
DirectX環(huán)境 |
DirectX 11 |
幀數(shù)監(jiān)控 |
Fraps 3.5.1 or Benchmark |

測試用主板:技嘉GA-X99-Gaming G1 WIFI

測試用內(nèi)存:影馳 GAMER DDR4-2400 8GB*4(玩家主場 電競內(nèi)存)
測試用固態(tài)硬盤:浦科特 PX-512M6S+
測試平臺軟件環(huán)境一覽
為保證系統(tǒng)平臺具有最佳穩(wěn)定性,本次產(chǎn)品測試所使用的操作系統(tǒng)為Microsoft Windows 10正版授權(quán)產(chǎn)品,除關(guān)閉自動休眠外,其余設(shè)置均保持默認,詳細軟件環(huán)境如下表所示。
測 試 平 臺 軟 件 環(huán) 境 |
操作系統(tǒng) |
Microsoft Windows 10 專業(yè)版 |
(64bit / 版本號:10240) |
主板芯片組驅(qū)動 |
Intel Chipset Device Software |
(WHQL / 版本號:9.2.3.1022) |
顯卡驅(qū)動 |
NVIDIA GeForce Game Ready Driver |
(版本號:368.39 WHQL) |
桌面環(huán)境 |
Microsoft Windows 10 專業(yè)版 |
(2560×1600 / 32bit / 60Hz) |
在測試成績方面,理論性能測試用得分來衡量性能,數(shù)值越高越好;游戲性能測試用游戲自帶Benchmark及游戲中平均幀數(shù)來衡量性能,數(shù)值同樣越高越好。
8理論性能測試:3DMark 11
理論性能測試:3DMark 11
在進行游戲測試之前,自然是要用權(quán)威的軟件來看看新卡的實力,首先是有資歷的3DMark 11。3DMark 11使用原生DirectX 11引擎,包含四個圖形測試項目,一項物理測試和一組綜合性測試,并提供了Demo演示模式。該測試程序使用了Bullet物理引擎,使用原生DirectX 11引擎,在測試場景中應(yīng)用了包括Tessellation曲面細分、Compute Shader以及多線程在內(nèi)的大量DX11新特性。

3DMARK 11

3DMARK 11 GPU成績
從3DMark 11的測試當(dāng)中GeForce GTX 1080彰顯出了GP104核心的強大實力,沒有任何目前已知的單芯顯卡產(chǎn)品能夠超越其性能,其得分大約是GTX Titan X的1.25倍,是GTX 980的1.72倍,性能的確如老黃所言。
9理論性能測試:3DMark FireStrike
理論性能測試:3DMark FireStrike
于北京時間2013年2月5日推出的新3DMark,采用全新界面設(shè)計,除了測試分?jǐn)?shù),還會展現(xiàn)每個場景測試期間的實時曲線,全程記錄幀率、CPU溫度、GPU溫度、CPU功耗。新3DMark取消了傳統(tǒng)的E、P、X模式,取而代之的是根據(jù)負載不同所推出的三個場景,其中FireStrike專為基于DirectX 11顯卡搭建的高端游戲平臺,而CloudGate則支持基于DirectX 10環(huán)境的主流硬件,IceStorm則支持入門級DirectX 9設(shè)備、手機、平板電腦等等。

3DMark FireStrike

3DMark FireStrike GPU成績
在3DMark FireStrike測試中,GTX 1080依舊是“秒全家”的節(jié)奏,其得分是GTX Titan X的1.24倍,是GTX 980的1.66倍。至于同其他顯卡的比較,我們覺得已經(jīng)沒有什么意義,哪怕是雙芯的R9 295x2依舊無法與之匹敵,唯一能戰(zhàn)勝GTX 1080的顯卡只有AMD雙芯旗艦Radeon Pro Duo。
10游戲性能測試:《古墓麗影9》
游戲性能測試:《古墓麗影9》
《古墓麗影9》是由Crystal Dynamics開發(fā),Square Enix負責(zé)發(fā)行的跨平臺系列動作游戲,2013年3月開始發(fā)售。本作聚焦于勞拉年輕的時期,摒棄了前幾作女超人的設(shè)定,玩家可以在游戲中看到更真實的勞拉年輕時代形象。由于引擎的升級,本作相比之前的作品會有更優(yōu)秀的畫面,是《古墓麗影》系列最具變革性的一作。

《古墓麗影9》

《古墓麗影9》1080p平均幀數(shù)

《古墓麗影9》2K平均幀數(shù)
《古墓麗影9》是一個比較老的游戲了,之所以拿出這個游戲作為測試項目,是因為《古墓麗影9》對顯卡的要求不算太高,在1080p分辨率下一張?zhí)瘘c級顯卡就可以完美運行,而甜點級顯卡恰恰是絕大多數(shù)用戶所擁有的。在《古墓麗影9》的測試中,GTX 1080呈現(xiàn)出了壓倒性的優(yōu)勢,在1080p分辨率下領(lǐng)先GTX Titan X 30余幀,而在2K分辨率下領(lǐng)先GTX Titan X 20余幀,是當(dāng)之無愧的性能之王。
11游戲性能測試:《全境封鎖》
游戲性能測試:《全境封鎖》
《全境封鎖》是一款開放世界第三人稱射擊角色扮演大型多人在線網(wǎng)絡(luò)游戲。游戲設(shè)定在瘟疫爆發(fā)后的美國,玩家作為“全境封鎖”計劃的部隊,在“黑色星期五”后的美國尋找一線生機。該作的大背景同《輻射》系列很類似,都是描繪大災(zāi)難后的世界,玩家需要在這個混亂的世界中尋找一線生機,可以說生存是玩家唯一的選擇。

《湯姆克蘭西:全境封鎖》

《湯姆克蘭西:全境封鎖》1080p平均幀數(shù)

《湯姆克蘭西:全境封鎖》2K平均幀數(shù)
測試完甜點級顯卡可駕馭的游戲,我們來測試一下次旗艦級顯卡才能夠應(yīng)對的《全境封鎖》。該游戲的官方推薦顯卡是GTX 970/R9 390,而在2K分辨率下的推薦顯卡為GTX 980Ti?梢钥吹,無論是常規(guī)分辨率還是2K分辨率,GTX 1080都可以完美應(yīng)對,其成績遙遙領(lǐng)先其余各卡,即使在2K分辨率下也可以達到78幀的超高幀數(shù)。
12游戲性能測試:《巫師3:狂獵》
游戲性能測試:《巫師3:狂獵》
《巫師3:狂獵》采用Redengine3引擎,作為一款次世代的RPG游戲作品,本作栩栩如生的真實環(huán)境還原以及全新角色面部動作和人物面部表情都成為了一大亮點。Redengine3引擎在支持各種全新圖形技術(shù)的同時也加快了地圖載入速度,經(jīng)由無縫地圖打造的宏大世界讓玩家可以自由無限制的漫游在游戲世界當(dāng)中。

《巫師3:狂獵》

《巫師3:狂獵》1080p平均幀數(shù)

《巫師3:狂獵》2K平均幀數(shù)
最后我們來測試一下素有顯卡殺手之稱的《巫師3》。作為一款真正意義上的次世代游戲《巫師3:狂獵》對硬件有著極高的要求,只有旗艦級顯卡才能在1080p分辨率下特效全開達到絕對流暢的60幀,而即便是上代的頂級旗艦也無法在2K分辨率下達到絕對流暢的60幀。通過測試我們可以看出,在2K分辨率下,GTX 1080依舊能夠達到70幀左右的成績,在1080p分辨率下更是超過了90幀,實力有目共睹。
13DX12性能測試:《奇點灰燼》
DX12性能測試:《奇點灰燼》
《奇點灰燼》是一款Stardock制作的即時戰(zhàn)略游戲。該作采用Oxide Games的Nitrous引擎打造,背景設(shè)定在遙遠的未來,那時人類完全以意識形態(tài)存在,人們已經(jīng)掌握了上帝一樣的力量。但是人類發(fā)現(xiàn)自己已經(jīng)處于戰(zhàn)爭之中,敵人就是一個叫做“Haalee”的具有意識形態(tài)的AI,企圖推翻人類在宇宙之中的統(tǒng)治地位。

《奇點灰燼》

《奇點灰燼》1080p平均幀數(shù)

《奇點灰燼》2K平均幀數(shù)
《奇點灰燼》是全球首款DX12游戲,其自帶的benchmark對游戲DX12性能有著很好的考量。在DX12測試中,GTX 1080依舊遙遙領(lǐng)先,在1080p分辨率High畫質(zhì)下,平均幀數(shù)達到了88幀,而在2K分辨率Extreme畫質(zhì)下,幀數(shù)依舊達到了65幀,強悍的性能讓人無話可說。
144K性能測試
4K性能測試
測試完相對常規(guī)的1080p和2K分辨率,接下來看看GTX 1080在4K分辨率下的表現(xiàn),測試結(jié)果如下:

GTX 1080 4K分辨率下游戲平均幀數(shù)
在GTX 1080之前,沒有任何一款顯卡可以在4K分辨率下特效全開流暢運行游戲,而通過上面5項游戲測試可以看出,有4項游戲達到了流暢所需的45幀,而上面三款開銷相對較小的游戲甚至可以實現(xiàn)完美運行,由此可見,GTX 1080即使面對4K超高畫質(zhì)也是毫不畏懼。
15網(wǎng)游性能測試
網(wǎng)游性能測試
測試完典型的單機大作,我們來看看在網(wǎng)游中GTX 1080的表現(xiàn)。由于GTX 1080有著超越旗艦級顯卡的性能,因此我們選擇的游戲是對顯卡有著一定要求的《風(fēng)暴英雄》和《魔獸世界》,而沒有選擇諸如LOL、CF等對顯卡性能要求并不是很高的游戲,GTX 1080在不同分辨率下的表現(xiàn)如下:

《魔獸世界》

《風(fēng)暴英雄》不同分辨率下幀數(shù)表現(xiàn)

《魔獸世界》不同分辨率下幀數(shù)表現(xiàn)
通過以上網(wǎng)游測試可以看出,即使在4K超高分辨率下,GTX 1080依舊可以跑到100幀以上的幀數(shù),運行起來毫無壓力。
16VR性能測試
VR性能測試
在VR測試部分,我們選擇了Steam平臺推出的一款名為“SteamVR Performance Test”的軟件程序,該程序可以全面檢測用戶的PC性能,考驗PC是否能夠支持VR設(shè)備穩(wěn)定流暢運行。SteamVR效能測試會透過一段2分鐘由Valve制作的《光圈科技機械人維修VR展示》來評估玩家電腦的渲染力。在收集相關(guān)數(shù)據(jù)后,它將判斷玩家所使用的系統(tǒng)能否維持在90fps的幀率運作以及VR內(nèi)容的視覺保真能否夠校調(diào)至建議的水平標(biāo)準(zhǔn)。

《SteamVR Performance Test》

《SteamVR Performance Test》測試結(jié)果

GTX 1080與GTX 980保真度對比
雖然在VR測試中GTX 1080的保真度同GTX Titan X沒有拉開差距,但區(qū)別還是很明顯的:GTX 1080的保真度呈現(xiàn)出一條完美的直線,沒有絲毫振動,而且已測試幀數(shù)達到了15000幀以上,GTX Titan X僅僅達到了12000幀,單就已測試幀數(shù)看,GTX 1080超過GTX Titan X 25%左右,而同上代的GTX 980相比,無論是幀數(shù)還是保真度都遙遙領(lǐng)先。

Single Pass Stereo技術(shù)
根據(jù)老黃在發(fā)布會上所說,得益于Single Pass Stereo技術(shù),GTX 1080有著兩倍于GTX Titan X的VR性能,而由于時間緊迫,我們這次進行VR測試只是簡單地考量了GTX 1080在VR應(yīng)用中的實際表現(xiàn),并沒有幀數(shù)的對比測試,在之后的VR專項測試中,我們會為大家?guī)碛嘘P(guān)GTX 1080的詳細VR性能測試。
17顯卡功耗及溫度測試
顯卡功耗及溫度測試
對于游戲顯卡來說,功耗和溫度仍舊是我們參考的必要數(shù)據(jù),因為這些數(shù)據(jù)聽起來好像是和性價比沒什么關(guān)心,但它作為輔助屬性密切影響玩家的實際游戲體驗,更高的功耗會帶來更多噪音和溫度,因此我們應(yīng)該全角度評價產(chǎn)品,而不是僅僅通過性能和價格。
溫度方面我們將繼續(xù)采用Furmark來進行測試,考慮到不同游戲之中,顯卡的負載率不同,尤其是低分辨率和高分辨率的負載率差異會讓顯卡的功耗完全無法測算平均數(shù)值。因此我們需要采用Furmark這樣的權(quán)威性烤機軟件,讓GPU芯片之中每一個運算單元完全滿載,充分發(fā)揮供電最大化的狀態(tài)才能得出準(zhǔn)確的成績。

顯卡烤機溫度為82℃
功耗方面我們則是采用Furamrk拷機,讓顯卡達到滿載狀態(tài),然后拍攝功耗儀實時功耗。我們將參數(shù)設(shè)定為1280*1024分辨率,開啟8*MSAA,最終GTX 1080以最高滿載溫度82℃的情況下完成測試,頻率穩(wěn)定在1.7GHz左右。在溫度較低時,在GPU boost 3.0的作用下,顯卡頻率一度飆升至1870MHz,當(dāng)溫度上升到溫度墻82℃是,顯卡穩(wěn)定在官方所述的boost頻率上。散熱器在滿載時,轉(zhuǎn)速也穩(wěn)定在50%,也就是2000轉(zhuǎn)左右,在這個轉(zhuǎn)速下的噪音還是可以接受的。

顯卡待機平臺功耗為58.7W(不包括顯示器)

顯卡滿載平臺功耗為270W(不包括顯示器)
得益于Pascal架構(gòu)的高能耗比,顯卡待機時的平臺功耗很低,只有58.7w,而顯卡滿載時,平臺的總功耗也不過270w,基本符合官方給出的180w的TDP。
18新卡皇開啟16nm新時代
新卡皇開啟16nm新時代
GeForce GTX 1080的測試至此已經(jīng)結(jié)束,其性能及各項特性相信各位看官應(yīng)該都有所認知了。從數(shù)據(jù)上看,基于Pascal架構(gòu)的新一代NVIDIA旗艦級顯卡在絕對性能上已經(jīng)完全超越了MAXWELL旗艦GTX Titan X,提升幅度約25%;而從功耗上看,GTX 1080的功耗僅為180w,是GTX Titan X的72%,也就是說GTX 1080的能耗比是GTX Titan X的1.74倍!

而且大家都知道,GTX 1080只是Pascal架構(gòu)的第一款游戲顯卡產(chǎn)品,其有著相對較大的功耗余量和工程設(shè)計余量。GTX 1080的CUDA處理器數(shù)量只有2560個,而完整的GP100核心的CUDA處理器數(shù)量為3840個,也就是說GP104-400核心照比GP100大核心閹割掉了1/3的CUDA處理器,閹割幅度同之前的GTX 980之于GTX Titan X相同。功耗上亦是,根據(jù)以往經(jīng)驗,NVIDIA單芯頂級旗艦的TDP一般是250w左右,而GTX 1080還沒有AMD R9 300系列甜點級顯卡的功耗高。我們知道的是,GTX Titan X有著GTX 980約1.3倍的性能,如果未來新泰坦使用的是GP100大核心,那么其至少也會有GTX 1080 1.3倍以上的性能。就目前測試結(jié)果看,GTX 1080已經(jīng)實現(xiàn)了完勝整個MAXWELL家族,那么之后的新泰坦和GTX 1080Ti必將會讓顯卡性能達到一個更高的高度。

得益于16nm制程和Pascal架構(gòu)的高效,所有基于全新Pascal架構(gòu)的公版產(chǎn)品都將會擁有遠勝于過去的功耗表現(xiàn),而非公版產(chǎn)品則擁有了更大的發(fā)揮空間和可利用余量。Pascal架構(gòu)顯卡最讓人驚奇的地方就在于頻率達到了前所未有的新高度,公版GTX 1080的默認頻率已經(jīng)高達1.6GHz,而根據(jù)之前外媒的曝光,有些非公版顯卡甚至默認頻率會超過2GHz!而在2GHz下的GTX 1080的3DMark FireStrike Extreme得分突破了12000,將AMD的雙芯旗艦Radeon Pro Duo也踩在腳下?梢灶A(yù)見,基于Pascal的非公版顯卡的性能將會比過去更為瘋狂,瘋狂到難以想象。所以無論是常規(guī)的游戲用戶,還是關(guān)注硬件可玩性和絕對性能的傳統(tǒng)DIY玩家,GTX 1000系列顯卡一定不會讓你失望。

為什么這一次NVIDIA會讓全新的產(chǎn)品線實現(xiàn)如此大的性能進步?誠然,制程的升級和架構(gòu)的改進必然會帶來性能的飛躍,可這種飛躍似乎與老黃以往的“利益至上”原則不太相符,一塊準(zhǔn)旗艦就把MAXWELL全家都秒了,誰還會去花8000元買塊Titan X而不花5000元買塊性能更強的GTX 1080?這不是要加速MAXWELL的停產(chǎn)么?原因其實大家可以猜到,那就是NVIDIA一家獨大的舒坦日子可能要到頭了,對手AMD要奮起直追了。

隨著NVIDIA將顯卡制程從28nm升級至16nm,老對手AMD也將制程升級到更低的14nm,這下AMD和NVIDIA又一次站在相同的起跑線上了。根據(jù)此前的報道,AMD主打中端的Polaris 10在實際測試中以更低的功耗完勝GeForce GTX 950,可見AMD也開始走高能耗比的路線了。為了在全新的1Xnm制程上占據(jù)主導(dǎo)地位,NVIDIA不得不放一個大招給AMD一個下馬威,而GTX 1080正是代表了NVIDIA必勝的決心。筆者我十分期待未來精彩的AN大戰(zhàn),是NVIDIA繼續(xù)穩(wěn)坐全球第一的寶座,還是AMD收復(fù)失地實現(xiàn)反殺,只有時間能告訴我們答案。

除性能外,價格也是眾多玩家所關(guān)心的地方,GTX 1080的建議零售價為4599元,F(xiàn)ounders Edition的價格為5399元?雌饋砝宵S還算是良心,建議零售價比GTX 980Ti的首發(fā)限價還便宜了100元。不過這個直譯過來叫做“創(chuàng)始人版”的版本讓很多人摸不著頭腦,怎么以前從來沒聽說過這個版本?其實Founders Edition就是之前的Reference Edition,也就是公版。根據(jù)NVIDIA官方說法,F(xiàn)ounders Edition相比此前的公版做工更加細致,包括采用全新設(shè)計的均熱板和鋁合金外殼等,性能和散熱比之前更加理想,因此價格上則更貴一些。此外,F(xiàn)ounders Edition照比之前的公版有著更長的壽命,玩家可以在很長一段時間內(nèi)買到這個信仰滿點的版本,而之前的公版只有在首發(fā)后的一段時間內(nèi)買到。

A New King
這次的GTX 1080除了在性能上做到了一覽眾山小,給了玩家們足夠大的驚喜,其搭載的各項技術(shù)也體現(xiàn)了NVIDIA追求卓越,以用戶為本的精神,全新的截圖技術(shù)Ansel、讓顯示更真實的同步多重投射、讓虛擬更現(xiàn)實的VR Works Audio,這所有的技術(shù)都表明,NVIDIA的確是全球視覺計算技術(shù)的行業(yè)領(lǐng)袖。NVIDIA仍舊在正確的技術(shù)進步的道路上不斷努力,一點點地增加著自己的技術(shù)儲備并推進技術(shù)前沿,用技術(shù)去改變世界,讓這個世界變得更加美好。
19NVIDIA GeForce GTX 1080詳細參數(shù)