- 云端增長正在加速成長,英特爾還在享受著在服務(wù)器芯片領(lǐng)域的壟斷地位;
- 然而,隨著摩爾定律放緩,云計(jì)算向更加復(fù)雜的應(yīng)用進(jìn)行轉(zhuǎn)移,因此英特爾的領(lǐng)導(dǎo)地位會(huì)受到威脅;
- 其它解決方案,如GPU和FPGA,現(xiàn)在的谷歌TPU可以更有效地解決云計(jì)算不斷變化的需求;
摩爾定律的放緩可能會(huì)產(chǎn)生重要影響,尤其是對(duì)英特爾來說。其在手機(jī)領(lǐng)域已經(jīng)失手,PC銷量在不斷下滑,但是迄今為止,這些大部分已經(jīng)從服務(wù)器領(lǐng)域獲得拯救,因?yàn)樵谠擃I(lǐng)域它還處于壟斷地位。
后者已經(jīng)受到了來自英偉達(dá)的GPU的攻擊,這些GPU執(zhí)行了一些任務(wù),尤其是并行處理了與人工智能相關(guān)的大數(shù)據(jù)任務(wù)。
英偉達(dá)在數(shù)據(jù)中心行業(yè)的發(fā)展可圈可點(diǎn),去年的增長率高達(dá)126%。
英特爾正在進(jìn)行反擊。如今數(shù)據(jù)中心的芯片優(yōu)先采用新的處理器平臺(tái)(節(jié)點(diǎn)),并且它已經(jīng)收購了Altera,可以提供FPGA技術(shù)以加速云計(jì)算。賽靈思是這條路線的另一個(gè)玩家。
FPGA是摩爾定律放緩打擊通用CPU的一個(gè)手段,因?yàn)樗恰艾F(xiàn)場可編程”,也就是可以在生產(chǎn)后根據(jù)用戶需求重新配置。
英特爾FPGA能夠用于加速大型數(shù)據(jù)系統(tǒng)的性能。英特爾FPGA通過提供定制化高帶寬、低延遲連接到網(wǎng)絡(luò)和存儲(chǔ)系統(tǒng),實(shí)現(xiàn)高速數(shù)據(jù)處理。另外,英特爾FPGA提供壓縮、數(shù)據(jù)過濾和算法加速。通過帶有OpenCL的英特爾FPGA SDK,你可以為計(jì)算和存儲(chǔ)系統(tǒng)快速研發(fā)加速方案。帶有OpenCL的英特爾FPGA SDK能夠讓軟件開發(fā)者很容易通過FPGA進(jìn)行設(shè)計(jì),它允許工程師利用高級(jí)????言進(jìn)行快速開發(fā)。
谷歌似乎找到另一種解決這個(gè)問題的方法。所采用的方案不是像CPU和GPU這樣的通用芯片,也不是FPGA等可編程芯片,而是專用芯片,如專用加速器。
Google正在做這件事,介紹(見文件)Tensor處理單元(TPU):
“谷歌的TPU在機(jī)器學(xué)習(xí)測試中超過英特爾的Xeon和英偉達(dá)的GPU一個(gè)數(shù)量級(jí)。TPU和基準(zhǔn)測試表明,它的速度比商業(yè)芯片快了15倍,性能提升30倍?!?/span>
令人印象深刻的是,所使用的基準(zhǔn)并不是最前沿的(本文認(rèn)為,2015年的測試,英特爾已經(jīng)提供了14納米CPU,而Nvidia擁有新的16納米GPU),因?yàn)闇y試是在2015年進(jìn)行的,但是再一次,TPU本身也不是特別尖端的(在頻率和處理器節(jié)點(diǎn)方面):
“40-W TPU是運(yùn)行在700 MHz的28 nm芯片,旨在加速Google的TensorFlow算法。 其主要邏輯單元包含65,536個(gè)8位乘法累加單元和24 MB緩存,提供每秒92個(gè)tera操作?!?/span>
把產(chǎn)品遷移到更小的節(jié)點(diǎn)上會(huì)提高性能,還有其它技巧:
“如果我們比較更新的芯片,顯示,我們可以通過使用K80的GDDR5內(nèi)存將28nm、0.7GHZ、40W的TPU性能提升三倍。(成本增加10W)”
如果不這樣的話,隨著TPU的成熟,它的性能可能會(huì)超過競爭對(duì)手?jǐn)U大自身優(yōu)勢:
“該TPU的數(shù)量級(jí)性能優(yōu)勢很少,這可能導(dǎo)致它會(huì)成為某些特定領(lǐng)域架構(gòu)的原型。我預(yù)計(jì)很多會(huì)構(gòu)建繼承者,它們的水平會(huì)提高很多。谷歌表示,關(guān)于短至15個(gè)月的設(shè)計(jì)周期表阻止了TPU中的許多節(jié)能功能。
TPU已經(jīng)應(yīng)用于谷歌的數(shù)據(jù)中心,但是公司沒有提供任何關(guān)于廣泛應(yīng)用的信息,也沒有說升級(jí)方式以及是否會(huì)將TPU賣給第三方?!?/span>
這對(duì)英特爾有明顯的警告,對(duì)英偉達(dá)屬于小幅度的:
TPU項(xiàng)目從2013年隨著從FPGA實(shí)驗(yàn)開始。“當(dāng)我們看到FPGA的性能無法和GPU相比的時(shí)候,我們拋棄了它,并且運(yùn)行速度加快TPU功耗會(huì)比GPU更低?!眻?bào)告指出。
總結(jié)
不久前,英特爾還沉迷于快速增長的服務(wù)器市場的壟斷地位。但是隨著摩爾定律的放緩,尤其是不管是存儲(chǔ)、簡單應(yīng)用還是復(fù)雜AI開始向云端轉(zhuǎn)移,英特爾的GPU無法有效地做這些工作,并且尋找有效的解決方案。
早期的替代者是英偉達(dá)的GPU或者Altera和賽靈思的FPGA。它們對(duì)英特爾沒有造成威脅,因?yàn)榉?wù)器仍然在跑CPU,幾乎全部來自英特爾,但是即使這樣,一些來自AMD、IBM和ARM基礎(chǔ)設(shè)計(jì)的新興競爭出現(xiàn)了。
但是GPU和FPGA的處理能力越來越強(qiáng),英特爾來自數(shù)據(jù)中心的增長收益開始變少。如今在復(fù)雜加速器似乎出現(xiàn)了一種新的模塊,如谷歌的TPU。這會(huì)造成多大的威脅?
對(duì)于初學(xué)者,你必須認(rèn)識(shí)到就像GPU和FPGA一樣,TPU無法在服務(wù)器中取代CPU。它通過有效地執(zhí)行一些任務(wù)就可以提供附加的處理能力。或者,有人會(huì)死或它可能會(huì)威脅到GPU和FPGA,但是似乎他們根據(jù)用戶的需求有各自的優(yōu)勢。但是,像GPU和GPGA,TPU會(huì)從英特爾占主導(dǎo)地位的CPU轉(zhuǎn)移處理能力。
因此,對(duì)英特爾來說,最好的方案是它的使用仍然局限于谷歌云自身。目前還沒有跡象表明谷歌是否計(jì)劃將TPU給第三方。它可能應(yīng)用TPU去加強(qiáng)自身的云應(yīng)用的性能優(yōu)勢,或者限制其對(duì)第三方供應(yīng)商的依賴。但是高級(jí)芯片業(yè)務(wù)受益于巨大的經(jīng)濟(jì)規(guī)模,所以我們認(rèn)為谷歌不太可能將其作為專有解決方案。
更重要的是,谷歌似乎開啟了一扇數(shù)據(jù)中心全新解決方案之門,而且是在15個(gè)月內(nèi)研發(fā)出來的。其它廠商跟了多久了?

