在多線程、多內核時代,頻率是否無關緊要?5年前,當英特爾宣布其有關架構的思想將發生轉變時,似乎給出了肯定的答復。但在一款將用于一系列服務器的Power微處理器中,IBM公司展現了通過增加頻率改進性能的例子。
英特爾集團副總裁Pat Gelsinger早在2001年的國際固態電路大會(ISSCC)上就曾透露,英特爾將不再通過刻意追求頻率的方式來保持功耗穩定,而將轉向多線程雙核設計。太陽微系統公司(Sun Microsystems)也采取了類似行動。
但在今年的ISSCC上,IBM卻反其道而行之,重新拿起頻率作為競爭的武器。IBM設計工程師提交了三份文件描述即將推出的Power6微處理器,Power6是為IBM自己的pSeries服務器開發的。目前銷售的雙核Power5+是采用90nm工藝制造、工作在1.9GHz范圍(不久將有更高頻率的版本)的一種設計。采用65nm工藝的Power6是工作在4到5GHz頻率范圍的處理器,將用于明年推出的服務器上,IBM的技術研發副總裁Mark Papermaster表示。
“我們不想對頻率視而不見,”Papermaster表示,“否則,你將與造成芯片發熱的主要原因失之交臂。但頻率與性能之間仍有關系。”
“英特爾從勝負未卜的局面中抽身而退之際,IBM卻開始推動頻率的爆炸,”The Envisioneering Group的主管Rick Doherty表示,“英特爾拱手認輸。他們不再嘗試跨越3.5 GHz頻率。”
Sun公司的Niagara微處理器擁有32個線程,總功耗為63W,圖為其功耗分布。
當Sun擁抱多線程時,也冷落了頻率。IBM的Power6將有單核和多核版本,每核2個線程;而在Sun公司現已出貨的Niagara微處理器中,每處理器核有4個線程,共計32個線程,工作于1.2 GHz。Sun的技術總監Ana-Sonia Leon稱:“Niagara有一條非常淺的流水線,是一款單發送、順序執行處理器,其總功耗為63W,每線程平均不到2W。”
“頻率沒給我們帶來性能,”Leon表示。“我們通過增加線程來改進性能。我們很清楚,這是正確的道路。”
《微處理器報告》的總編Kevin Krewell表示:“當有大量線程空閑等待任務時,Sun的多線程方法工作很好。Sun能并行利用Niagara內的處理器核。但IBM擁有需要極強數據處理能力的客戶,這是它們將于Sun的Rock服務器短兵相接的領域(Rock是Ultrasparc設計的下一個重要升級版)。”
IBM Power6的首席工程師Brad McCredie表示,IBM采用了1條13級流水線——7級用于浮點運算單元、6級用于整數運算,與Power5的相同。但Power5中需要22個“4路扇出”邏輯級(其中,一個反相器驅動其它4個)完成的任務,現在,在Power6中,用13個“4路扇出”邏輯級就能實現(每級流水線一個)。
“通過使邏輯‘動’起來,可以提升性能,”McCredie表示,“我們將頻率加倍,并保持流水線深度不變,從而使每個邏輯級能發揮更大功用。目標是從每個晶體管中獲得更多邏輯功能。如我們不采取這種作法,將使流水線級崩潰。某些公司采用20、30和40個流水線級,實是命懸一線。”
IBM對更高頻率意味著更大功耗這點不置可否。“降低功耗的實用手段是監測設計的晶體管數,”McCredie表示。他還補充說所有晶體管都不相同。例如,緩存是非常有規則的結構,所以其閥值電壓可以更高。就功耗而言,對閃存進行操作比操作邏輯部分所需的功耗低。
雙核Power6有7.5億只晶體管,比英特爾的Montecito版安騰(Itanium)少約1百萬只,IBM的技術評估項目經理Joel Tendler表示。
McCredie表示,Power6有第二個片上存儲器控制器,以使存儲器帶寬加倍。“我們費盡心機確保帶寬能隨處理器而變,”他說。
Tendler拒絕透露緩存大小、操作電壓或功耗。他說,對IBM客戶重要的是服務器級功耗,而非芯片級功耗。IBM單講頻率但不說相應芯片級功耗的舉動令ISSCC的與會工程師頗有微詞,一位英特爾的工程師就稱這毫無意義。
在ISSCC上,并沒透露Power6的某些技術細節。Power6的電路主管Brian Curran表示,二進制浮點單元(BFU)采用高閥值電壓晶體管以降低漏電流。BFU運行在4GHz、工作于1.1 V時的功耗為310mW。在采用相同流水線、每周期指令數和鎖存周期開銷的條件下,Power6的BFU采用54個“4路扇出”邏輯級,而Power5是91個。整數執行單元需要78個“4路扇出”邏輯級,在運行在4GHz、1.1 V時,功耗為160mW。
McCredie:頻率加倍并保持流水線深度不變。
Curran表示,IBM將動態單元的使用降至少,以降低功耗。另外,“我們設計的電路執行不止一項功能,每個電路都擔負更多任務。我們將上述舉措與低的鎖存延遲結合起來;一個更低的延遲設計幫助了更高頻率的實現。”他說。
IBM的工程師在實驗室中,演示了一款運行于5.1GHz、工作在1.3V的Power6,Curran表示。
英特爾安騰電路和技術主管Sam Naffziger表示,IBM“借用”了首先發軔于英特爾的理念,例如,大量采用脈沖控制的鎖存器而不是主/從型的翻轉觸發器。據他說,早先IBM和英特爾的設計使用的是主/從翻轉觸發器。“脈沖控制鎖存器的開銷只有主/從鎖存器的一半,這樣就能在每個邏輯級中節省1到2個‘4路扇出’,”他說。
“對電路進行調整以從相同的流水線中得到更高頻率,IBM干得很漂亮。”他接著說,“頻率的確有其作用。如能保持相同的流水線深度和功耗,更高頻率當然能提升性能。”
“英特爾工程師仍在進行提高頻率的工作,”Naffziger聲稱,“在安騰系列中,繼Montecito后的Tukwila版將有更多的高頻核。”
英特爾的微處理器研究總監Shekhar Borkar表示:“英特爾早在1999年就認定高頻下的低‘4路扇出’不省電。我們從1.6 GHz的Centrino處理器開始,將重點從高頻和功耗方面轉移。
IBM落在了后面。”
在ISSCC上,英特爾的工程師Stefan Rusu描述了英特爾的雙核Tulsa。Tulsa是一款65 nm的Xeon服務器處理器,運行于3.4 GHz,功耗為150W。Rusu介紹,Tulsa有一個16MB的L3緩存,共計13.28億只晶體管。該晶體管數在目前報道過的衍生于X86架構的設計中是多的。
Rusu說,英特爾沒有在緩存中采用多個晶體管閥值電壓(在Tulsa內,采用多個晶體管閥值電壓是降低功耗的通用技術);相反,緩存中大量使用更長溝道長度的晶體管。這種晶體管以較慢的頻率運行,但漏電流降低了3倍,他說。
McCredie介紹,IBM采用了3個閥值電壓,并對Power6的溝道長度進行調節以在漏電流和性能之間取得平衡。
作者:來大偉