2015年6月30日 星期二

‧ 靠 A72 進軍伺服器市場,ARM 有機會嗎?

leiphone maomaobear


日前,ARM在深圳召開了2015 ARM Tech Forum,會議上沒有太多新東西。還是前一段發佈的A72架構,和CoreLink CCI-500,不過近來,ARM一直對Intel把持的伺服器和資料中心市場很感興趣。

ARM高級副總裁Pete Hutton樂觀表示,到2017ARM將在伺服器晶片市場,佔有5-10%的市佔率,Canaccord銀行的分析師更樂觀認為,到2018ARM將能贏得伺服器晶片市場的20%的市佔率。

為何ARM如此有信心?在Intel把持的伺服器市場,ARM會有機會嗎?

一、A72架構和CoreLink CCI-500
長期以來,ARM走的都是低功耗,低性能路線,產品性能距離桌面的X86處理器很遠,更不用說伺服器晶片了。但是隨著智慧手機的不斷升級,和PC市場的停滯,這個性能差距越來越小。

A9之後,ARM意識到自己無法在性能和功耗之間兼顧,於是推出了大小核的策略,ARM稱之為big.LITTLE,在低負載用小核心,高負載用大核心,平衡性能與功耗的矛盾。這樣ARM就可以不太顧及功耗發展高性能核心。

第一款產品是A15,第二代是A57,如今的A72理論上是第三代產品。按照ARM的說法,Cortex-A72是其性能最出色、最先進的處理器,構建在Cortex-A57的基礎之上,性能可達Cortex-A15 3.5倍。

不過,從架構圖和規格表上看,A72A57並沒有本質的不同,仍舊最多四核心,一級二級的暫存容量都沒變,只是做了一些細節調整,比較明顯的變化是,砍去了NEON SIMD引擎中的加密擴展功能,匯流排界面擴展到128bit

ARM自己則說,是通過對讀寫指令操作的不斷優化,以及細節上的創新,提升了性能降低了功耗。

不過,我們要知道,按照ARM這種性能演算法,A57A15也有1.9倍的性能提升。那是建立在20nm28nm工藝的基礎之上的。同樣,A72這個所謂3.5倍的性能提升,也是建立在16nmfinFET28nm的製程優勢上。如下圖:


實際上,ARMA57在同頻下相對於A15只有25%-30%的提升。1.9GHZA15specint2000,大約是1100分,1.7GHZA57specint20001250分。

按照ARM的比例,3.5倍的A72相比,1.9倍的A57只提升了1.84倍,估計同頻A72相對於A57,大約也是25%左右的提升。也就是1.7GhzA72Specint2000,大約在1550分。

而根據前不久華為提供的內部測試的資料,同頻同製程下,A72相對於A57,只有大約5%的性能提升。功耗也只下降了5%左右。

華為的資料或許沒發揮出A72的潛力,但是A72相比A57,在核心上的進步並不如ARM描述的,那麼大恐怕是事實。

核心上進步不太大,真正的進步是 CoreLink CCI-500CoreLink CCI-500最大的變化,就是增加了一個“探聽篩檢程式”(Snoop Filter),從而使探聽控制,不再局限於單個簇內部的CPU之間,可以擴展到整個處理器的所有核心。

過去,ARM雖然支持多核心,但實際上是四個核心一個簇,簇內部是有偵聽的,可以解決快取一致性的問題,而簇之間是沒有的,所以從四核心到八核心會有一定的性能下降。

ARM提倡的大小核恰恰是八核心的,這次增加“探聽篩檢程式” ,可以提升多核心的性能。而 CoreLink CCI-500最多支援的CPU簇,從2個增加到4個,每個簇可以支援四個處理器,這樣算最多可以支援16個處理器。

處理器增加,多核心效率提升,這就給進軍高性能建設鋪好了路。

在記憶體性能方面,ARM宣稱CoreLink CCI-500,可以提升30%的記憶體性能。再加上CoreLink CCI-500的記憶體,提升到了四通道128-bit記憶體,這樣資料的吞吐能力也有可觀的提升,這對伺服器來說至關重要。

所以,ARM的信心來源還是技術,在大小核戰略之後,ARM的大核心性能,已經有了長足進步,單個核心已經逼近Intel當年的酷睿2處理器,但是功耗卻不大。性能功耗比不錯。

另外一方面, CoreLink CCI-500提升了核心的支持數量,提升了多核心效率,還提升了記憶體性能與頻寬,這都對伺服器的性能是好事。
ARM的野心勃勃來自於技術的提升。

二、ARM有機會嗎?
其實ARM進軍伺服器不是現在才開始提的,2011Calxeda推出了搭載480ARM處理器核心的低功耗伺服器,惠普的微伺服器也採用Calxeda的晶片,2013年百度採用MARVELLARM處理器搭建伺服器。
但是這些嘗試都失敗了,因為當年的ARM處理器太弱,如今ARM憑技術進步,想要捲土重來,它有機會嗎?

單純從性能看,ARM確實有了進步,現在用ARM指令集的晶片做伺服器,在多核心支援上,記憶體頻寬上都值得嘗試。

但問題是,伺服器不僅僅是個性能問題。多年以來,在硬體上、軟體上、網路標準上,Intel已經深耕多年,IBMHP這類巨頭也已經在Intel的戰車上捆綁了多年。

即使在IBM自己的PowerPC的小底盤,也是有成型的標準規範,ARM作為一個後來者加入,很難被接受。

你換用了ARM指令集的晶片,你的儲存設備能否配套,原來的軟體怎麼辦?原來的系統怎麼辦?原來的資料備份怎麼處理?

這種轉換的成本非常之高,幾乎不可能遷移。

Intel也不是固步自封,在智慧手機市場,Intel雖然走錯了路,但是追的很快。目前,Intel的智慧手機晶片性能,並不比ARM差。雖然在智慧手機上因為安卓系統的原因,發揮不出來,但是到了伺服器市場,換上Intel熟悉的軟體環境,就是ARM有力無處使了。

在伺服器上,Intel同級別的晶片完勝ARM,使用者完全可以用Intel的低功耗晶片方案,來解決問題,成本會比換用ARM更低。
而且Intel還防禦性的收購了Altera,真正要做低功耗低成本,ARM也不是對手。

在高性能領域,Intel有眾核方面,其效率也不是ARM靠堆晶片所能比擬的。

所以,從硬體到軟體,使用者都沒有換馬的必要,嘗試ARM不過是試水而已。

雖然ARM自己的技術進步了不少,但是在伺服器市場機會依然渺茫。

                                                                                                                                                                                                                            

沒有留言:

張貼留言