日前,ARM在深圳召開了2015 ARM Tech Forum,會議上沒有太多新東西。還是前一段發佈的A72架構,和CoreLink CCI-500,不過近來,ARM一直對Intel把持的伺服器和資料中心市場很感興趣。
ARM高級副總裁Pete Hutton樂觀表示,到2017年ARM將在伺服器晶片市場,佔有5-10%的市佔率,Canaccord銀行的分析師更樂觀認為,到2018年ARM將能贏得伺服器晶片市場的20%的市佔率。
為何ARM如此有信心?在Intel把持的伺服器市場,ARM會有機會嗎?
一、A72架構和CoreLink CCI-500
長期以來,ARM走的都是低功耗,低性能路線,產品性能距離桌面的X86處理器很遠,更不用說伺服器晶片了。但是隨著智慧手機的不斷升級,和PC市場的停滯,這個性能差距越來越小。
在A9之後,ARM意識到自己無法在性能和功耗之間兼顧,於是推出了大小核的策略,ARM稱之為big.LITTLE,在低負載用小核心,高負載用大核心,平衡性能與功耗的矛盾。這樣ARM就可以不太顧及功耗發展高性能核心。
第一款產品是A15,第二代是A57,如今的A72理論上是第三代產品。按照ARM的說法,Cortex-A72是其性能最出色、最先進的處理器,構建在Cortex-A57的基礎之上,性能可達Cortex-A15 3.5倍。
不過,從架構圖和規格表上看,A72和A57並沒有本質的不同,仍舊最多四核心,一級二級的暫存容量都沒變,只是做了一些細節調整,比較明顯的變化是,砍去了NEON SIMD引擎中的加密擴展功能,匯流排界面擴展到128bit。
ARM自己則說,是通過對讀寫指令操作的不斷優化,以及細節上的創新,提升了性能降低了功耗。
不過,我們要知道,按照ARM這種性能演算法,A57比A15也有1.9倍的性能提升。那是建立在20nm對28nm工藝的基礎之上的。同樣,A72這個所謂3.5倍的性能提升,也是建立在16nmfinFET對28nm的製程優勢上。如下圖:
實際上,ARM的A57在同頻下相對於A15只有25%-30%的提升。1.9GHZ的A15跑specint2000,大約是1100分,1.7GHZ的A57跑specint2000是1250分。
按照ARM的比例,3.5倍的A72相比,1.9倍的A57只提升了1.84倍,估計同頻A72相對於A57,大約也是25%左右的提升。也就是1.7Ghz的A72跑Specint2000,大約在1550分。
而根據前不久華為提供的內部測試的資料,同頻同製程下,A72相對於A57,只有大約5%的性能提升。功耗也只下降了5%左右。
華為的資料或許沒發揮出A72的潛力,但是A72相比A57,在核心上的進步並不如ARM描述的,那麼大恐怕是事實。
核心上進步不太大,真正的進步是 CoreLink CCI-500,CoreLink CCI-500最大的變化,就是增加了一個“探聽篩檢程式”(Snoop Filter),從而使探聽控制,不再局限於單個簇內部的CPU之間,可以擴展到整個處理器的所有核心。
過去,ARM雖然支持多核心,但實際上是四個核心一個簇,簇內部是有偵聽的,可以解決快取一致性的問題,而簇之間是沒有的,所以從四核心到八核心會有一定的性能下降。
而ARM提倡的大小核恰恰是八核心的,這次增加“探聽篩檢程式” ,可以提升多核心的性能。而 CoreLink CCI-500最多支援的CPU簇,從2個增加到4個,每個簇可以支援四個處理器,這樣算最多可以支援16個處理器。
處理器增加,多核心效率提升,這就給進軍高性能建設鋪好了路。
在記憶體性能方面,ARM宣稱CoreLink CCI-500,可以提升30%的記憶體性能。再加上CoreLink CCI-500的記憶體,提升到了四通道128-bit記憶體,這樣資料的吞吐能力也有可觀的提升,這對伺服器來說至關重要。
所以,ARM的信心來源還是技術,在大小核戰略之後,ARM的大核心性能,已經有了長足進步,單個核心已經逼近Intel當年的酷睿2處理器,但是功耗卻不大。性能功耗比不錯。
另外一方面, CoreLink CCI-500提升了核心的支持數量,提升了多核心效率,還提升了記憶體性能與頻寬,這都對伺服器的性能是好事。
ARM的野心勃勃來自於技術的提升。
二、ARM有機會嗎?
其實ARM進軍伺服器不是現在才開始提的,2011年Calxeda推出了搭載480個ARM處理器核心的低功耗伺服器,惠普的微伺服器也採用Calxeda的晶片,2013年百度採用MARVELL的ARM處理器搭建伺服器。
但是這些嘗試都失敗了,因為當年的ARM處理器太弱,如今ARM憑技術進步,想要捲土重來,它有機會嗎?
單純從性能看,ARM確實有了進步,現在用ARM指令集的晶片做伺服器,在多核心支援上,記憶體頻寬上都值得嘗試。
但問題是,伺服器不僅僅是個性能問題。多年以來,在硬體上、軟體上、網路標準上,Intel已經深耕多年,IBM、HP這類巨頭也已經在Intel的戰車上捆綁了多年。
即使在IBM自己的PowerPC的小底盤,也是有成型的標準規範,ARM作為一個後來者加入,很難被接受。
你換用了ARM指令集的晶片,你的儲存設備能否配套,原來的軟體怎麼辦?原來的系統怎麼辦?原來的資料備份怎麼處理?
這種轉換的成本非常之高,幾乎不可能遷移。
而Intel也不是固步自封,在智慧手機市場,Intel雖然走錯了路,但是追的很快。目前,Intel的智慧手機晶片性能,並不比ARM差。雖然在智慧手機上因為安卓系統的原因,發揮不出來,但是到了伺服器市場,換上Intel熟悉的軟體環境,就是ARM有力無處使了。
在伺服器上,Intel同級別的晶片完勝ARM,使用者完全可以用Intel的低功耗晶片方案,來解決問題,成本會比換用ARM更低。
而且Intel還防禦性的收購了Altera,真正要做低功耗低成本,ARM也不是對手。
在高性能領域,Intel有眾核方面,其效率也不是ARM靠堆晶片所能比擬的。
所以,從硬體到軟體,使用者都沒有換馬的必要,嘗試ARM不過是試水而已。
雖然ARM自己的技術進步了不少,但是在伺服器市場機會依然渺茫。
0 comments:
張貼留言