華文網

「乾貨」一文看懂銳龍AMD Ryzen 7技術架構解析與產品介紹

點擊上方藍字“微型電腦”快速關注

銳龍AMD Ryzen 7處理器是之前AMD早已透露,

基於命名為AMD Zen處理器架構的產品。MC在之前的多篇文章中都已經對Zen架構的技術細節進行了詳細的介紹,因此本文不再重複這些內容,只是針對AMD在其正式產品發佈會上重點提及的內容,以及Ryzen處理器在應用功能上加入的全新技術、產品最終配套規格進行解讀。

進入14nm時代——來自“GF”的禮物

AMD早期在債務問題的壓力下,將自有晶圓廠出售給相關投資人獲取現金流,晶圓廠而後獨立成立了格羅方德(GLOBAL FOUNDRIES),

也就是人們常說的“GF”。目前,從規模來看格羅方德目前已是全球第三大代工企業。不過,由於晶片製造工藝研發難度極高、投入極大以及投資週期漫長等原因,GF從成立到現在幾乎年年虧損,工藝進步上表現也不夠出色。

GF的弱勢再加上AMD在推土機架構上的失誤,導致AMD在CPU工藝上一直止步不前,直到現在AMD FX系列處理器還在使用32nm工藝。在隨後的28nm、22nm時代,GF都沒有為AMD製造CPU產品。

直到AMD不得不花費一億美元和GF重新簽署了協定,改變了和GF的代工綁定關係,APU等產品開始交由TSMC等代工,AMD才開始在產品工藝上逐漸追上時代。

在Zen架構的實現上,AMD幾乎面臨著“最後一戰”——只許成功不許失敗。在這種情況下,GF先是獲得了三星的14nm工藝授權,然後試產成功;AMD也通過和GF深入合作,終於在Ryzen處理器上成功完成產品製造。

AMD 銳龍AMD Ryzen 7處理器核心晶圓照片

在工藝方面,本次AMD為其最新的銳龍AMD Ryzen 7使用的是GF/三星面向高性能產品的14nm FinFET LPP工藝,其VDD電壓為0.8V,工藝的CPP(可以理解為兩個相鄰電晶體之間的距離)為78nm,鰭片片距為64nm,金屬層之間的距離為64nm。相比之下,英特爾的14nm工藝的三個關鍵性資料—CPP是70nm、鰭片片距是45nm、金屬層之間距離是52nm,全部都顯著好于GF/三星的工藝。

Zen架構的設計目標是相比上代產品提升40%的IPC,實際達到了52%之多。

當然,英特爾工藝再好,AMD也無法享用。因此,AMD將很大部分的精力放在電源管理控制(後文還有詳談)以及晶片本身優化方面。實際結果是,根據AMD官方的資料,Zen架構四核心八執行緒的一個模組面積為44平方毫米,每個核心512KB的L2緩存佔據了1.5平方毫米,8MB的L3緩存總計佔用了16平方毫米。

Zen架構的基本特性和架構簡圖,

大部分內容我們在之前的文章中都有詳細介紹。

相比之下,英特爾對應的資料是49平方毫米、0.9平方毫米(256KB)和19.1平方毫米。可以看出,雖然AMD受制於工藝問題,在電晶體物理密度上難以達到對方的水準,但是經過調優後,AMD晶片面積反而小於英特爾對應的類似部件,最終實現了在工藝水準上的逼近。

更注重單執行緒性能的SMT架構

在這一部分,本文不會過於詳細的分前端、後端、緩存等部分詳細介紹Zen架構,而是從宏觀角度著手,根據Zen架構的核心設計目標,對Zen架構為達到目標做出的設計和改進進行介紹。如果想進一步深入瞭解Zen架構詳細細節的讀者,可以參閱本刊往期的文章。根據AMD的介紹,AMD在Zen架構設計上主要瞄準了三個目標:更好的核心性能、更好的緩存性能和更出色的更低的功耗。

Zen架構在緩存上的改進,主要是朝著更快、更大的方向而去。

對於核心來說,從各種帳面資料來看,Zen變得更大、更寬,比如更大的分派、更大的退出、更大的調度器和更好的分支預測都意味著處理器能夠在更長的時間內保持更高的吞吐能力。不過在保持更大和更寬的同時,資料延遲也需要很好的處理,Zen可以採用諸如micro-op緩存來説明大多數指令流改進性能,並繞過潛在長週期重複操作的部分。此外,添加SMT同步多執行緒技術也可以使運算單元被滿佇列地佔用,提高了處理器的運算效率。

AMD處理器未來會支援逆向超執行緒技術嗎?

AMD產品經理James Prior先生

終於,AMD現在也支援與超執行緒技術類似的同步多執行緒技術了,那麼AMD處理器未來是否也能支援傳說中的逆向多執行緒技術呢?本刊特別對AMD產品經理James Prior先生進行了專訪。

MC:近年來,只要新款處理器發佈都可能會有這麼個傳言,未來會有個類似逆向多執行緒的技術把多核的計算能力模擬成單核。從技術角度而言,真的可行嗎?

James:我相信程式師可以寫出來,但是實際的性能沒準兒會更慢,所以並沒有什麼意義。你看,要想享受多執行緒的便利,傳統的程式設計方法是把程式執行緒分成多個塊,然後分配到多執行緒中去。如果你想嘗試把所有的塊合起來丟到一個執行緒中,整個時間反而可能會長得多得多,效率大幅降低。

緩存方面,速度變得更重要。Zen的緩存速度變得更快、頻寬變得更大。更快的緩存和更大的頻寬降低了處理器等待所需消耗的時間。AMD宣稱Zen的L1加入了回寫功能、資料讀入FPU的時間從之前的9個迴圈降低到了現在的7個迴圈,L1和L2的資料預取功能變得更好了,L1和L2的頻寬相比之前的產品提升了1倍、L3頻寬甚至提升了4倍之多。

一個CCX共用8MB L3緩存

在功耗方面,由於AMD之前在低功耗處理器上有不錯的表現,因此Zen架構繼承了絕大部分功能。諸如更積極地檢測核心關鍵路徑,更好地控制各個區域的頻率和功耗。Zen將有更多的時鐘區域,不同的時鐘區域可以運行不同的頻率以提高效率。其他諸如微指令緩存、堆疊引擎、移動消除等設計,都使得處理器的功耗表現變得更為出色,效率更高。

Zen架構可以支援與英特爾超執行緒技術類似的SMT同步多執行緒技術

從設計上看,Zen採用了目前主流的4發射設計,兩路SMT支援,微指令緩存等。Zen在很多關鍵性參數上和英特爾的設計有一定的相似。諸如決定亂序執行視窗大小的關鍵指標之一的重排序緩衝區,Zen與Haswell同為192項,Skylake為224項。

在決定緩存資料訪問能力的關鍵指標Load/Store佇列上,Zen與Haswell完全一致,在亂序執行引擎中負責保存運算元的寄存器堆容量上,Zen與Haswell也基本持平。在亂序執行引擎中負責保存待發射指令的保留站上,Zen領先於Haswell。這些資料的相似,說明Zen已經徹底以單核心性能為主要目標,這也和之前AMD提到IPC大幅度提升的理念是完全吻合的。

細節方面,Zen架構也充滿了亮點。比如Zen使用了某種壓縮BTB設計,讓一個BTB保存兩個分支,相當於將BTB的有效大小翻番,同時保持相同的訪問延遲。指令緩存的配置是64KB、4路組關聯,每週期32Byte的取指令頻寬,而英特爾是32KB,8路組關聯,每週期16Byte的取指令頻寬,Zen在帳面資料上略微勝出。

在解碼方面,AMD還加入了一層微指令佇列用於實現獨立的迴圈緩衝區(loop buffer),在執行迴圈指令時最大限度地關閉前端來節省功耗,另一面也可以縮減實際流水線長度。Zen的執行階段使用了6分派6發射,四個整數執行單元的結構令ZEN的整數執行能力保持完好,每個週期可以執行兩條分支指令,對高發射寬度下的分支預測,以及分支指令聚集的情況會有所説明。

CCX(CPU Complex)CPU運算模組結構圖

另外,Zen的架構設計上還巧妙地採用了名為CCX(CPU Complex)的模組化設計方案。一個CCX模組中有4個核心,每個核心擁有自己獨立的L1和L2緩存,一個CCX模組共用8MB L3緩存。每個核心都可以選擇性地開啟或者關閉SMT功能,也可以選擇性地關閉部分核心。從設計角度來看,AMD選擇CCX的模組化設計,理念是非常先進的。AMD巧妙地平衡了成本和擴展性之間的很多問題。

根據AMD的資料來看,Zen架構的CCX模組之間是處於相對獨立的關係,兩個模組採用Infinity Fabric匯流排進行通訊。有技術報導稱Infinity Fabric採用了先進的光纖傳輸技術,頻寬和延遲都足夠優秀,因此,AMD可以通過為處理器不斷地添加CCX來擴充處理器的核心規模。

沒有集成圖形核心是否有影響?

AMD技術市場經理Robert Hallock先生

與FX處理器類似,銳龍AMD Ryzen 7處理器也沒有集成圖形核心,那麼它是否能勝任直播、推流這類傳統依賴圖形核心的應用呢?為此我們對AMD技術市場經理Robert Hallock先生進行了專訪。

MC:相比Intel的產品,銳龍 AMD Ryzen7處理器在直播推流上有何優勢?

Robert:做直播推流的夥計們告訴我們,直播推流還是CPU的效果最好。沒錯,你確實可以使用內建的視訊轉碼器來直播推流,比如Intel Quick-Sync,又或者NVIDIA和AMD顯卡內置的視訊轉碼器。不過,這種方式的畫質和效果都有所限制,CPU是解除這種限制最好的方式。比如,我們的八核十六執行緒,你可以用其中的四核八執行緒玩遊戲,另外的四核八執行緒用在解碼和推流上。這樣既可以得到畫質最高的視頻,也不會耽誤遊戲時間,一舉兩得。

相比之下,英特爾和AMD的模組化設計理念存在很大不同。英特爾在八核心、十核心等處理器的模組化設計只是核心部分,甚至不包括L3緩存,核心之間是採用環狀匯流排和L3緩存綁定在一起的。也就是說,英特爾的所有處理器都掛接在統一的匯流排上,資料一致性通過統一的L3緩存保證,這樣做的優勢在於最大限度地提升處理器的性能和緩存的利用率,但是設計難度更高、功耗控制也更不容易。

與此相應的是,Zen的某個核心如果跨CCX調用資料的話,延遲肯定長到難以忍受,因此考慮快取一致性要求的話,很可能8核心銳龍AMD Ryzen 7處理器(L3緩存總容量16MB)實際有意義的L3緩存容量只有8MB,兩個CCX模組L3緩存中的資料是一致的,並通過匯流排進行同步。目前AMD尚未對這個問題進行說明,還需要更多資料才能進一步解釋清楚。

總的來看,Zen的架構設計完成了AMD給出的三個目標,在功耗、緩存和功能上表現都很令人滿意,最終的性能實現了大幅度領先之前的推土機架構家族,徹底站在了和英特爾平起平坐的地位上。

功耗和頻率控制——AMD SenseMI五大技術

AMD之前的處理器在功耗控制上表現不是很理想,不過隨著AMD推出了數代APU產品以及一些面向低功耗設備的產品,AMD在功耗和頻率控制上變得愈發成熟。這次在銳龍AMD Ryzen 7處理器上,AMD一口氣推出了五項功耗和頻率控制技術,並將其打包成一個系列,命名為AMD SenseMI。

根據AMD的說明,SenseMI包含諸如Pure Power、Precision Boost、Extended Frequency Range、Neural Net Prediction、Smart Prefetch多項技術。下面我們分別介紹如下:

1

1.Pure Power技術是AMD的一項全面監控技術,AMD在Ryzen處理器中內置了超過1300個關鍵路徑監視器、48個片上高速電源檢測器、20個熱量二極體、9個高速降速偵測器。通過這所有的探測器件,AMD可以精確掌握處理器每個部分的電壓、熱量、頻率和功耗情況。

2

2.Precision Boost指精准頻率提升,Ryzen的處理器頻率可以25MHz為單位調整,直到達到功耗和溫度允許的最大值。

3

3.Extended Frequency Range是指自我調整動態擴頻技術,簡寫為XFR技術。這項技術的優勢在於,當用戶使用高端散熱器或者處理器的溫度在安全範圍內時,處理器即使已經運行在最高Boost頻率上,XFR技術還可以讓處理器繼續提升一小段頻率範圍,從而獲得更高的頻率和更好的性能。當然XFR技術和之前的Pure Power以及Precision Boost技術聯合使用才能達到這樣的效果。

4

4.Neural Net Prediction神經網路預測,該技術能夠大大減少現代CPU在運行中由於分支預測失敗而造成的流水線重載,並影響性能的情況出現。從AMD的簡介中可以看出,Ryzen加入了三級TLB,對指令拾取功能做出了加強;通過神經網路預測,能夠自主學習、類比之前分支預測的情況,從而降低失敗概率並在每週期實現兩個分支的預測。更大的L1、L2 BTB部分能夠允許容納更多指令以提高效率。另外,32路的返回堆疊和512路的ITA都能在很大程度上提升整體性能。

5

5.Smart Prefetch 智慧資料預取,這項技術是指AMD在資料預取功能上加入了自動學習功能,可以根據之前的程式使用情況來判斷正在執行的程式可能需要什麼資料,並將其預取至緩存中,加快資料執行速度。

實際上,從玩家角度來看,前三項技術組成的頻率提升功能是最能直觀感受到性能增加的。為此,AMD也給出了一張圖用於表示XFR結合Pure Power以及精准頻率提升能帶來的效果。

AMD XFR技術,可以再度提升處理器頻率。

以Ryzen 7 1800X為例,這款處理器的基準頻率為3.6GHz,最大單核心的Boost頻率為4GHz,所有八核心同時Boost的最大頻率為3.7GHz。當高負載、單執行緒應用開始運行時,處理器會在溫度和功耗允許的情況下,迅速提升頻率到4.1GHz,並在溫度達到上限後降至4.0GHz,隨後再次提升至4.1GHz,然後長期穩定在4GHz運行。

當啟動的處理器核心數量大於2個後,處理器頻率降低至3.7GHz,隨後根據功耗情況不斷在3.6GHz和3.7GHz之間動態調節。當處理器檢測到任務已經基本完成時,頻率降低至3.2GHz,然後Pure Power檢測到處理器處於空閒狀態時,會迅速降低處理器頻率到2.2GHz進入節能狀態。

目前AMD發佈的三款處理器都支援XFR技術

上述整個過程,完全是基於AMD Ryzen各項技術自動化完成的,不需要使用者手動操作,也不需要任何協力廠商軟體的干涉。不過部分消息稱,目前諸如XFR等技術在使用時和Windows 10作業系統配合還存在一些問題,建議使用者不要使用作業系統的“平衡模式”,這種模式下作業系統會接管處理器。只有改成“高性能”模式,XFR功能才會更好地發揮作用。

三英登場——銳龍AMD Ryzen 7處理器首批產品簡介

AMD和英特爾在產品策略上存在很大差異,和英特爾常年忠實於Core酷睿、Pentium奔騰以及Celeron賽揚三大消費品牌不同的是,AMD在每次更換架構後都會同步更新核心品牌—從早期的Athlon速龍,到後來的Phenom羿龍、AMD FX等,幾乎每一個重要的架構節點上,AMD都會推出一款全新的處理器品牌。

在全新的“Zen”架構啟用後,AMD宣佈了處理器的英文品牌Ryzen,這個單詞的讀音和英文單詞“risen”比較接近,包含了AMD即將冉冉升起、不斷上升的美好願望。相對應的,Ryzen處理器的中文名為“銳龍”,繼承了AMD一貫以來的“龍家族”。在產品品牌確定後,AMD還打算以Ryzen為核心,打造一整套產品。

AMD在Ryzen家族處理器的命名上有一整套規則

其命名規則如下,以銳龍 AMD Ryzen 7 1700X為例,首先,銳龍AMD Ryzen作為產品名稱和商標,是固定不變的。其次,隨後的“7”指代的是頂級,“5”指代的是高性能產品,“3”是指主流產品,這和英特爾的酷睿系列處理器劃分有異曲同工之妙。

第三,接下來的型號則分為兩個部分,這裡的“1700”的“7”是指發燒級產品,與此類似的還有8。相應的,AMD也會推出4、5、6來代表高性能級別產品。至於主流級別,目前暫時沒有確定,當然也有可能是3。另外,在最後兩位尾數上,AMD會使用00、20、50等類似的數位來區分性能和頻率等。

最後則是尾碼。X代表高性能處理器,擁有XFR功能。無尾碼就是標準版本產品、G則是帶圖形核心的桌上出版本產品、T則是低功耗桌上出版本、S則是低功耗且擁有圖形核心的桌上出版處理器、H是高性能移動版本處理器、U是標準的移動版處理器,M則是低功耗移動版處理器。

通過對產品型號的定義,AMD Ryzen處理器將擁有一個齊全、完善的產品線。不過本次AMD發佈的銳龍AMD Ryzen處理器只有三款,分別是Ryzen 7 1800X、Ryzen 7 1700X和Ryzen 7 1700。這些產品的具體規格清單如下:

目前AMD首發的處理器都是八個核心,包括兩個CCX。根據AMD的規劃,未來的Ryzen 5系列和Ryzen 3系列處理器將可能出現六核心和四核心產品,甚至不排除低端的Zen架構處理器會有雙核心產品出現,當然是否冠之以銳龍AMD Ryzen品牌,那就要看AMD對市場的判斷了。

AM4正式降臨——銳龍AMD Ryzen處理器的外觀和介面

一般來說,處理器這樣的產品在外觀上不會有太多內容。比如酷睿處理器和AMD之前的FX系列處理器,都是直接刻上產品型號和基本規格,普普通通。不過在Ryzen處理器上,AMD不但像平常那樣印上了產品型號、代碼等,還特別將Ryzen商標印在了處理器頂蓋上,整體視覺效果看起來比較富有衝擊力。

銳龍AMD Ryzen處理器正面外觀,可見大寫的RYZEN字樣(左為Ryzen 7 1700X,右為Ryzen 7 1800X)。

除了外觀,再來看看銳龍AMD Ryzen處理器的AM4介面。從尺寸來看,AM4的長寬和FM2、AM3+基本相同。AM4介面和之前的AM3介面在外觀上最大的差別就是:AM3介面的針腳幾乎是鋪滿了處理器底部基板,在AM4上則變成在處理器基板底部中央區域留空。

當然,處理器針腳所占的面積減少,並不意味著針腳數量降低—實際上,AM4的針腳數量高達1331個,比之前AM3/AM3+的處理器部分的938/941個針腳大幅度提升,更是超出FM2+介面的906個針腳不少。考慮到全新的Ryzen支援了DDR4記憶體以及更快速的匯流排,還要為新一代APU服務,預留更多的針腳也是可以理解的。

銳龍AMD Ryzen處理器背面(圖左)與AM3處理器(圖右)完全不同。

此外,AM4將介面插槽從之前的OPGA換成了uOPGA,最大熱設計功耗也提升至140W以上,未來可以推出更多高TDP功耗的產品。所謂uOPGA,是指針腳的直徑更小,因此在同樣大的CPU底座上可以支援更多的信號線和針腳存在。

全新扣具、全新散熱器——銳龍AMD Ryzen的散熱方案

由於功耗降低,AMD這次為銳龍AMD Ryzen處理器推出的散熱器無論是用料還是設計都比較“輕量化”了。當然,面對超頻玩家,AMD還是準備了一款使用熱管的散熱器,希望能夠盡可能轉移熱量、提高頻率。根據AMD官方資料,AMD的三款名為Stealth、Spire和Max散熱器分別針對65W TDP、95W TDP以及超頻用戶。其中前兩款採用了靜音設計,AMD宣稱其最高噪音分別為28dB(A)和32dB(A)。針對超頻用戶的散熱器最高噪音則為38dB(A)。

AMD為搭配Ryzen上市,推出了三款全新散熱器。

從外觀圖可以看出,Spire和Max上採用了紅色燈帶設計,在使用時會有紅色圓形燈光,比較漂亮,適合使用側透主機殼的用戶。用料方面,Stealth和Spire都是鋁擠設計,大塊的鋁配合鰭片以及下壓的風力將熱量匯出;只有Max採用了雙熱管設計,配有兩根熱管、銅制底座以及回流焊鰭片,在導熱和散熱方面的表現將更為出色。

除了官方散熱器外,協力廠商散熱器也是很多玩家關注的重點。不過由於AMD的孔距是96mm×48mm,和之前AM3的90mm×54mm存在較大差異,因此絕大部分現有的、支持AM3的散熱器無法使用在AM4平臺上。對於這個問題,要麼用戶更換全新的散熱器或者底座,要麼用戶可以諮詢一下散熱器廠商。目前也有一些廠商目前在官網上給出聲明,可以為用戶免費更換散熱器扣具。

雙通道DDR4——Ryzen的記憶體搭配

我們知道,銳龍AMD Ryzen處理器最高端的規格採用了8核心、16執行緒設計,因此對記憶體頻寬是相當渴求的,畢竟八個核心都需要從記憶體調用資料的時候資料量可真不小。與此相應的是,英特爾在八核心處理器上採用的是四通道記憶體,實際上英特爾很早就開始嘗試多於雙通道的記憶體設計了,第一代Nehalem Core i7處理器採用的就是三通道記憶體。不過正如前文架構所說,考慮到更多通道記憶體控制器的複雜性、晶片面積和功耗等問題,AMD最終還是選擇了雙通道記憶體,只是記憶體支援了主流的DDR4,同時頻率也大幅度提升。

AMD官方建議的銳龍AMD Ryzen處理器記憶體搭配方式

同時,AMD在發佈會上針對銳龍AMD Ryzen與DDR4記憶體的搭配還專門給出了一張幻燈片解釋:如果使用者使用4根雙面記憶體,頻率最高為DDR4 1866,使用4根單面記憶體則可以達到DDR4 2133;如果使用者只使用2根雙面記憶體,頻率最高為DDR4 2400;只使用兩根單面記憶體,頻率最高則可達DDR4 2667。不過在我們實際的測試中,其雙通道記憶體頻率還是能夠達到DDR4 3000的。

AMD 300系列主機板——Ryzen配套主機板晶片組

同時,AMD也準備了一整套主機板晶片組來搭配銳龍AMD Ryzen處理器家族。在發佈會上,AMD公佈了三款晶片組,分別是X370、B350和A320,其中只有X370一款是全新發佈。後兩款產品在之前的Bristol Ridge發佈時就已經和大家見過面了。除了這三款外,AMD還專門為SFF小型機市場準備了X300和A300兩款產品,不過本次暫時不會推出。

Ryzen可搭配的處理器晶片組與規格差異

從AMD對產品的定位來看,X是指頂級產品,B是指商務系列,A則是主流產品。其中X和B系列產品都是不鎖倍頻的,用戶可以搭配不鎖倍頻的處理器實現對倍頻的調節,從而進行超頻,A系列則不開放超頻功能,AMD用一張表格(本頁左下)詳細解釋了三款晶片組的規格。

由於大量的參數都在表格中說的很清楚了,本文就不再贅述,只帶來一些其他方面的消息。從產品規格來看,由於處理器的SoC化,AMD Ryzen實際上已經將諸如記憶體控制器、PCIe匯流排控制器等元件集成,晶片組的作用實際上相當於傳統的南橋,提供SATA、USB、NVMe等埠等。有埠就意味著存在資料流程,也就對頻寬提出了要求。

不同晶片組之間的功能差異

在晶片組和處理器的連接方面,AMD沒有使用自家的HT匯流排,轉而採用了標準化的PCIe通道。銳龍AMD Ryzen處理器一共內建了24個PCIe 3.0通道,除去獨立顯卡使用的16條之外,還有4條分給NVMe、SATA、USB 3.0等介面,最後的4條PCIe 3.0通道用於連接晶片組。

一般來說,晶片組使用PCIe 3.0 x4連接頻寬還是比較充足的,因此諸如X370這樣的晶片組還能額外提供8條PCIe 2.0通道。為了區分產品等級,B350則只能提供6條PCIe 2.0通道,最低端的A320只有4條。其它介面方面,包括NVMe、原生的USB 3.1 GEN2、SATA Express等都一應俱全。

對頂級玩家而言,如果需要組建諸如SLI、CrossFire這樣的多顯卡系統的話,只有X370主機板可選。因為只有X370才可以將一個PCIe 3.0 x16拆分成兩個PCIe 3.0 x8,相比之下,B350和A320都無法提供類似功能。另外,AMD官方沒有聲明自家的晶片組可以支持SLI功能。但在很多X370主機板上,廠商往往都標明同時提供SLI和CrossFire功能,這應該是廠商單獨和英偉達溝通授權的結果。

而是從宏觀角度著手,根據Zen架構的核心設計目標,對Zen架構為達到目標做出的設計和改進進行介紹。如果想進一步深入瞭解Zen架構詳細細節的讀者,可以參閱本刊往期的文章。根據AMD的介紹,AMD在Zen架構設計上主要瞄準了三個目標:更好的核心性能、更好的緩存性能和更出色的更低的功耗。

Zen架構在緩存上的改進,主要是朝著更快、更大的方向而去。

對於核心來說,從各種帳面資料來看,Zen變得更大、更寬,比如更大的分派、更大的退出、更大的調度器和更好的分支預測都意味著處理器能夠在更長的時間內保持更高的吞吐能力。不過在保持更大和更寬的同時,資料延遲也需要很好的處理,Zen可以採用諸如micro-op緩存來説明大多數指令流改進性能,並繞過潛在長週期重複操作的部分。此外,添加SMT同步多執行緒技術也可以使運算單元被滿佇列地佔用,提高了處理器的運算效率。

AMD處理器未來會支援逆向超執行緒技術嗎?

AMD產品經理James Prior先生

終於,AMD現在也支援與超執行緒技術類似的同步多執行緒技術了,那麼AMD處理器未來是否也能支援傳說中的逆向多執行緒技術呢?本刊特別對AMD產品經理James Prior先生進行了專訪。

MC:近年來,只要新款處理器發佈都可能會有這麼個傳言,未來會有個類似逆向多執行緒的技術把多核的計算能力模擬成單核。從技術角度而言,真的可行嗎?

James:我相信程式師可以寫出來,但是實際的性能沒準兒會更慢,所以並沒有什麼意義。你看,要想享受多執行緒的便利,傳統的程式設計方法是把程式執行緒分成多個塊,然後分配到多執行緒中去。如果你想嘗試把所有的塊合起來丟到一個執行緒中,整個時間反而可能會長得多得多,效率大幅降低。

緩存方面,速度變得更重要。Zen的緩存速度變得更快、頻寬變得更大。更快的緩存和更大的頻寬降低了處理器等待所需消耗的時間。AMD宣稱Zen的L1加入了回寫功能、資料讀入FPU的時間從之前的9個迴圈降低到了現在的7個迴圈,L1和L2的資料預取功能變得更好了,L1和L2的頻寬相比之前的產品提升了1倍、L3頻寬甚至提升了4倍之多。

一個CCX共用8MB L3緩存

在功耗方面,由於AMD之前在低功耗處理器上有不錯的表現,因此Zen架構繼承了絕大部分功能。諸如更積極地檢測核心關鍵路徑,更好地控制各個區域的頻率和功耗。Zen將有更多的時鐘區域,不同的時鐘區域可以運行不同的頻率以提高效率。其他諸如微指令緩存、堆疊引擎、移動消除等設計,都使得處理器的功耗表現變得更為出色,效率更高。

Zen架構可以支援與英特爾超執行緒技術類似的SMT同步多執行緒技術

從設計上看,Zen採用了目前主流的4發射設計,兩路SMT支援,微指令緩存等。Zen在很多關鍵性參數上和英特爾的設計有一定的相似。諸如決定亂序執行視窗大小的關鍵指標之一的重排序緩衝區,Zen與Haswell同為192項,Skylake為224項。

在決定緩存資料訪問能力的關鍵指標Load/Store佇列上,Zen與Haswell完全一致,在亂序執行引擎中負責保存運算元的寄存器堆容量上,Zen與Haswell也基本持平。在亂序執行引擎中負責保存待發射指令的保留站上,Zen領先於Haswell。這些資料的相似,說明Zen已經徹底以單核心性能為主要目標,這也和之前AMD提到IPC大幅度提升的理念是完全吻合的。

細節方面,Zen架構也充滿了亮點。比如Zen使用了某種壓縮BTB設計,讓一個BTB保存兩個分支,相當於將BTB的有效大小翻番,同時保持相同的訪問延遲。指令緩存的配置是64KB、4路組關聯,每週期32Byte的取指令頻寬,而英特爾是32KB,8路組關聯,每週期16Byte的取指令頻寬,Zen在帳面資料上略微勝出。

在解碼方面,AMD還加入了一層微指令佇列用於實現獨立的迴圈緩衝區(loop buffer),在執行迴圈指令時最大限度地關閉前端來節省功耗,另一面也可以縮減實際流水線長度。Zen的執行階段使用了6分派6發射,四個整數執行單元的結構令ZEN的整數執行能力保持完好,每個週期可以執行兩條分支指令,對高發射寬度下的分支預測,以及分支指令聚集的情況會有所説明。

CCX(CPU Complex)CPU運算模組結構圖

另外,Zen的架構設計上還巧妙地採用了名為CCX(CPU Complex)的模組化設計方案。一個CCX模組中有4個核心,每個核心擁有自己獨立的L1和L2緩存,一個CCX模組共用8MB L3緩存。每個核心都可以選擇性地開啟或者關閉SMT功能,也可以選擇性地關閉部分核心。從設計角度來看,AMD選擇CCX的模組化設計,理念是非常先進的。AMD巧妙地平衡了成本和擴展性之間的很多問題。

根據AMD的資料來看,Zen架構的CCX模組之間是處於相對獨立的關係,兩個模組採用Infinity Fabric匯流排進行通訊。有技術報導稱Infinity Fabric採用了先進的光纖傳輸技術,頻寬和延遲都足夠優秀,因此,AMD可以通過為處理器不斷地添加CCX來擴充處理器的核心規模。

沒有集成圖形核心是否有影響?

AMD技術市場經理Robert Hallock先生

與FX處理器類似,銳龍AMD Ryzen 7處理器也沒有集成圖形核心,那麼它是否能勝任直播、推流這類傳統依賴圖形核心的應用呢?為此我們對AMD技術市場經理Robert Hallock先生進行了專訪。

MC:相比Intel的產品,銳龍 AMD Ryzen7處理器在直播推流上有何優勢?

Robert:做直播推流的夥計們告訴我們,直播推流還是CPU的效果最好。沒錯,你確實可以使用內建的視訊轉碼器來直播推流,比如Intel Quick-Sync,又或者NVIDIA和AMD顯卡內置的視訊轉碼器。不過,這種方式的畫質和效果都有所限制,CPU是解除這種限制最好的方式。比如,我們的八核十六執行緒,你可以用其中的四核八執行緒玩遊戲,另外的四核八執行緒用在解碼和推流上。這樣既可以得到畫質最高的視頻,也不會耽誤遊戲時間,一舉兩得。

相比之下,英特爾和AMD的模組化設計理念存在很大不同。英特爾在八核心、十核心等處理器的模組化設計只是核心部分,甚至不包括L3緩存,核心之間是採用環狀匯流排和L3緩存綁定在一起的。也就是說,英特爾的所有處理器都掛接在統一的匯流排上,資料一致性通過統一的L3緩存保證,這樣做的優勢在於最大限度地提升處理器的性能和緩存的利用率,但是設計難度更高、功耗控制也更不容易。

與此相應的是,Zen的某個核心如果跨CCX調用資料的話,延遲肯定長到難以忍受,因此考慮快取一致性要求的話,很可能8核心銳龍AMD Ryzen 7處理器(L3緩存總容量16MB)實際有意義的L3緩存容量只有8MB,兩個CCX模組L3緩存中的資料是一致的,並通過匯流排進行同步。目前AMD尚未對這個問題進行說明,還需要更多資料才能進一步解釋清楚。

總的來看,Zen的架構設計完成了AMD給出的三個目標,在功耗、緩存和功能上表現都很令人滿意,最終的性能實現了大幅度領先之前的推土機架構家族,徹底站在了和英特爾平起平坐的地位上。

功耗和頻率控制——AMD SenseMI五大技術

AMD之前的處理器在功耗控制上表現不是很理想,不過隨著AMD推出了數代APU產品以及一些面向低功耗設備的產品,AMD在功耗和頻率控制上變得愈發成熟。這次在銳龍AMD Ryzen 7處理器上,AMD一口氣推出了五項功耗和頻率控制技術,並將其打包成一個系列,命名為AMD SenseMI。

根據AMD的說明,SenseMI包含諸如Pure Power、Precision Boost、Extended Frequency Range、Neural Net Prediction、Smart Prefetch多項技術。下面我們分別介紹如下:

1

1.Pure Power技術是AMD的一項全面監控技術,AMD在Ryzen處理器中內置了超過1300個關鍵路徑監視器、48個片上高速電源檢測器、20個熱量二極體、9個高速降速偵測器。通過這所有的探測器件,AMD可以精確掌握處理器每個部分的電壓、熱量、頻率和功耗情況。

2

2.Precision Boost指精准頻率提升,Ryzen的處理器頻率可以25MHz為單位調整,直到達到功耗和溫度允許的最大值。

3

3.Extended Frequency Range是指自我調整動態擴頻技術,簡寫為XFR技術。這項技術的優勢在於,當用戶使用高端散熱器或者處理器的溫度在安全範圍內時,處理器即使已經運行在最高Boost頻率上,XFR技術還可以讓處理器繼續提升一小段頻率範圍,從而獲得更高的頻率和更好的性能。當然XFR技術和之前的Pure Power以及Precision Boost技術聯合使用才能達到這樣的效果。

4

4.Neural Net Prediction神經網路預測,該技術能夠大大減少現代CPU在運行中由於分支預測失敗而造成的流水線重載,並影響性能的情況出現。從AMD的簡介中可以看出,Ryzen加入了三級TLB,對指令拾取功能做出了加強;通過神經網路預測,能夠自主學習、類比之前分支預測的情況,從而降低失敗概率並在每週期實現兩個分支的預測。更大的L1、L2 BTB部分能夠允許容納更多指令以提高效率。另外,32路的返回堆疊和512路的ITA都能在很大程度上提升整體性能。

5

5.Smart Prefetch 智慧資料預取,這項技術是指AMD在資料預取功能上加入了自動學習功能,可以根據之前的程式使用情況來判斷正在執行的程式可能需要什麼資料,並將其預取至緩存中,加快資料執行速度。

實際上,從玩家角度來看,前三項技術組成的頻率提升功能是最能直觀感受到性能增加的。為此,AMD也給出了一張圖用於表示XFR結合Pure Power以及精准頻率提升能帶來的效果。

AMD XFR技術,可以再度提升處理器頻率。

以Ryzen 7 1800X為例,這款處理器的基準頻率為3.6GHz,最大單核心的Boost頻率為4GHz,所有八核心同時Boost的最大頻率為3.7GHz。當高負載、單執行緒應用開始運行時,處理器會在溫度和功耗允許的情況下,迅速提升頻率到4.1GHz,並在溫度達到上限後降至4.0GHz,隨後再次提升至4.1GHz,然後長期穩定在4GHz運行。

當啟動的處理器核心數量大於2個後,處理器頻率降低至3.7GHz,隨後根據功耗情況不斷在3.6GHz和3.7GHz之間動態調節。當處理器檢測到任務已經基本完成時,頻率降低至3.2GHz,然後Pure Power檢測到處理器處於空閒狀態時,會迅速降低處理器頻率到2.2GHz進入節能狀態。

目前AMD發佈的三款處理器都支援XFR技術

上述整個過程,完全是基於AMD Ryzen各項技術自動化完成的,不需要使用者手動操作,也不需要任何協力廠商軟體的干涉。不過部分消息稱,目前諸如XFR等技術在使用時和Windows 10作業系統配合還存在一些問題,建議使用者不要使用作業系統的“平衡模式”,這種模式下作業系統會接管處理器。只有改成“高性能”模式,XFR功能才會更好地發揮作用。

三英登場——銳龍AMD Ryzen 7處理器首批產品簡介

AMD和英特爾在產品策略上存在很大差異,和英特爾常年忠實於Core酷睿、Pentium奔騰以及Celeron賽揚三大消費品牌不同的是,AMD在每次更換架構後都會同步更新核心品牌—從早期的Athlon速龍,到後來的Phenom羿龍、AMD FX等,幾乎每一個重要的架構節點上,AMD都會推出一款全新的處理器品牌。

在全新的“Zen”架構啟用後,AMD宣佈了處理器的英文品牌Ryzen,這個單詞的讀音和英文單詞“risen”比較接近,包含了AMD即將冉冉升起、不斷上升的美好願望。相對應的,Ryzen處理器的中文名為“銳龍”,繼承了AMD一貫以來的“龍家族”。在產品品牌確定後,AMD還打算以Ryzen為核心,打造一整套產品。

AMD在Ryzen家族處理器的命名上有一整套規則

其命名規則如下,以銳龍 AMD Ryzen 7 1700X為例,首先,銳龍AMD Ryzen作為產品名稱和商標,是固定不變的。其次,隨後的“7”指代的是頂級,“5”指代的是高性能產品,“3”是指主流產品,這和英特爾的酷睿系列處理器劃分有異曲同工之妙。

第三,接下來的型號則分為兩個部分,這裡的“1700”的“7”是指發燒級產品,與此類似的還有8。相應的,AMD也會推出4、5、6來代表高性能級別產品。至於主流級別,目前暫時沒有確定,當然也有可能是3。另外,在最後兩位尾數上,AMD會使用00、20、50等類似的數位來區分性能和頻率等。

最後則是尾碼。X代表高性能處理器,擁有XFR功能。無尾碼就是標準版本產品、G則是帶圖形核心的桌上出版本產品、T則是低功耗桌上出版本、S則是低功耗且擁有圖形核心的桌上出版處理器、H是高性能移動版本處理器、U是標準的移動版處理器,M則是低功耗移動版處理器。

通過對產品型號的定義,AMD Ryzen處理器將擁有一個齊全、完善的產品線。不過本次AMD發佈的銳龍AMD Ryzen處理器只有三款,分別是Ryzen 7 1800X、Ryzen 7 1700X和Ryzen 7 1700。這些產品的具體規格清單如下:

目前AMD首發的處理器都是八個核心,包括兩個CCX。根據AMD的規劃,未來的Ryzen 5系列和Ryzen 3系列處理器將可能出現六核心和四核心產品,甚至不排除低端的Zen架構處理器會有雙核心產品出現,當然是否冠之以銳龍AMD Ryzen品牌,那就要看AMD對市場的判斷了。

AM4正式降臨——銳龍AMD Ryzen處理器的外觀和介面

一般來說,處理器這樣的產品在外觀上不會有太多內容。比如酷睿處理器和AMD之前的FX系列處理器,都是直接刻上產品型號和基本規格,普普通通。不過在Ryzen處理器上,AMD不但像平常那樣印上了產品型號、代碼等,還特別將Ryzen商標印在了處理器頂蓋上,整體視覺效果看起來比較富有衝擊力。

銳龍AMD Ryzen處理器正面外觀,可見大寫的RYZEN字樣(左為Ryzen 7 1700X,右為Ryzen 7 1800X)。

除了外觀,再來看看銳龍AMD Ryzen處理器的AM4介面。從尺寸來看,AM4的長寬和FM2、AM3+基本相同。AM4介面和之前的AM3介面在外觀上最大的差別就是:AM3介面的針腳幾乎是鋪滿了處理器底部基板,在AM4上則變成在處理器基板底部中央區域留空。

當然,處理器針腳所占的面積減少,並不意味著針腳數量降低—實際上,AM4的針腳數量高達1331個,比之前AM3/AM3+的處理器部分的938/941個針腳大幅度提升,更是超出FM2+介面的906個針腳不少。考慮到全新的Ryzen支援了DDR4記憶體以及更快速的匯流排,還要為新一代APU服務,預留更多的針腳也是可以理解的。

銳龍AMD Ryzen處理器背面(圖左)與AM3處理器(圖右)完全不同。

此外,AM4將介面插槽從之前的OPGA換成了uOPGA,最大熱設計功耗也提升至140W以上,未來可以推出更多高TDP功耗的產品。所謂uOPGA,是指針腳的直徑更小,因此在同樣大的CPU底座上可以支援更多的信號線和針腳存在。

全新扣具、全新散熱器——銳龍AMD Ryzen的散熱方案

由於功耗降低,AMD這次為銳龍AMD Ryzen處理器推出的散熱器無論是用料還是設計都比較“輕量化”了。當然,面對超頻玩家,AMD還是準備了一款使用熱管的散熱器,希望能夠盡可能轉移熱量、提高頻率。根據AMD官方資料,AMD的三款名為Stealth、Spire和Max散熱器分別針對65W TDP、95W TDP以及超頻用戶。其中前兩款採用了靜音設計,AMD宣稱其最高噪音分別為28dB(A)和32dB(A)。針對超頻用戶的散熱器最高噪音則為38dB(A)。

AMD為搭配Ryzen上市,推出了三款全新散熱器。

從外觀圖可以看出,Spire和Max上採用了紅色燈帶設計,在使用時會有紅色圓形燈光,比較漂亮,適合使用側透主機殼的用戶。用料方面,Stealth和Spire都是鋁擠設計,大塊的鋁配合鰭片以及下壓的風力將熱量匯出;只有Max採用了雙熱管設計,配有兩根熱管、銅制底座以及回流焊鰭片,在導熱和散熱方面的表現將更為出色。

除了官方散熱器外,協力廠商散熱器也是很多玩家關注的重點。不過由於AMD的孔距是96mm×48mm,和之前AM3的90mm×54mm存在較大差異,因此絕大部分現有的、支持AM3的散熱器無法使用在AM4平臺上。對於這個問題,要麼用戶更換全新的散熱器或者底座,要麼用戶可以諮詢一下散熱器廠商。目前也有一些廠商目前在官網上給出聲明,可以為用戶免費更換散熱器扣具。

雙通道DDR4——Ryzen的記憶體搭配

我們知道,銳龍AMD Ryzen處理器最高端的規格採用了8核心、16執行緒設計,因此對記憶體頻寬是相當渴求的,畢竟八個核心都需要從記憶體調用資料的時候資料量可真不小。與此相應的是,英特爾在八核心處理器上採用的是四通道記憶體,實際上英特爾很早就開始嘗試多於雙通道的記憶體設計了,第一代Nehalem Core i7處理器採用的就是三通道記憶體。不過正如前文架構所說,考慮到更多通道記憶體控制器的複雜性、晶片面積和功耗等問題,AMD最終還是選擇了雙通道記憶體,只是記憶體支援了主流的DDR4,同時頻率也大幅度提升。

AMD官方建議的銳龍AMD Ryzen處理器記憶體搭配方式

同時,AMD在發佈會上針對銳龍AMD Ryzen與DDR4記憶體的搭配還專門給出了一張幻燈片解釋:如果使用者使用4根雙面記憶體,頻率最高為DDR4 1866,使用4根單面記憶體則可以達到DDR4 2133;如果使用者只使用2根雙面記憶體,頻率最高為DDR4 2400;只使用兩根單面記憶體,頻率最高則可達DDR4 2667。不過在我們實際的測試中,其雙通道記憶體頻率還是能夠達到DDR4 3000的。

AMD 300系列主機板——Ryzen配套主機板晶片組

同時,AMD也準備了一整套主機板晶片組來搭配銳龍AMD Ryzen處理器家族。在發佈會上,AMD公佈了三款晶片組,分別是X370、B350和A320,其中只有X370一款是全新發佈。後兩款產品在之前的Bristol Ridge發佈時就已經和大家見過面了。除了這三款外,AMD還專門為SFF小型機市場準備了X300和A300兩款產品,不過本次暫時不會推出。

Ryzen可搭配的處理器晶片組與規格差異

從AMD對產品的定位來看,X是指頂級產品,B是指商務系列,A則是主流產品。其中X和B系列產品都是不鎖倍頻的,用戶可以搭配不鎖倍頻的處理器實現對倍頻的調節,從而進行超頻,A系列則不開放超頻功能,AMD用一張表格(本頁左下)詳細解釋了三款晶片組的規格。

由於大量的參數都在表格中說的很清楚了,本文就不再贅述,只帶來一些其他方面的消息。從產品規格來看,由於處理器的SoC化,AMD Ryzen實際上已經將諸如記憶體控制器、PCIe匯流排控制器等元件集成,晶片組的作用實際上相當於傳統的南橋,提供SATA、USB、NVMe等埠等。有埠就意味著存在資料流程,也就對頻寬提出了要求。

不同晶片組之間的功能差異

在晶片組和處理器的連接方面,AMD沒有使用自家的HT匯流排,轉而採用了標準化的PCIe通道。銳龍AMD Ryzen處理器一共內建了24個PCIe 3.0通道,除去獨立顯卡使用的16條之外,還有4條分給NVMe、SATA、USB 3.0等介面,最後的4條PCIe 3.0通道用於連接晶片組。

一般來說,晶片組使用PCIe 3.0 x4連接頻寬還是比較充足的,因此諸如X370這樣的晶片組還能額外提供8條PCIe 2.0通道。為了區分產品等級,B350則只能提供6條PCIe 2.0通道,最低端的A320只有4條。其它介面方面,包括NVMe、原生的USB 3.1 GEN2、SATA Express等都一應俱全。

對頂級玩家而言,如果需要組建諸如SLI、CrossFire這樣的多顯卡系統的話,只有X370主機板可選。因為只有X370才可以將一個PCIe 3.0 x16拆分成兩個PCIe 3.0 x8,相比之下,B350和A320都無法提供類似功能。另外,AMD官方沒有聲明自家的晶片組可以支持SLI功能。但在很多X370主機板上,廠商往往都標明同時提供SLI和CrossFire功能,這應該是廠商單獨和英偉達溝通授權的結果。