在信息量日益擴張的當下,數(shù)據(jù)中心逐漸向規(guī)模化集成化發(fā)展,不斷擴張的體量使得數(shù)據(jù)中心的散熱及安全性等問題日漸突出,創(chuàng)新與變革正在各大公司的數(shù)據(jù)中心得到實踐。作為系列文章的收官之作,本文以各公司的工程實例為依據(jù)介紹數(shù)據(jù)中心的發(fā)展趨勢,立足當下,放眼未來。
液體冷卻或成新的行業(yè)趨勢
液體冷卻系統(tǒng)在數(shù)據(jù)中心的采用率越來越高,采用由于能耗更低的能源,將為數(shù)據(jù)中心冷卻市場發(fā)展提供驅動力。安裝在數(shù)據(jù)中心設施中的機架數(shù)量正在不斷增加,功率密度也在不斷增加。目前,供應商已經(jīng)提出了各種可替代空氣冷卻的冷卻解決方案,這些解決方案基于一種技術。這種解決方案自微處理器時代以來一直不是常態(tài),當時大型機占據(jù)了主導地位。通過使用液體冷卻劑代替壓縮空氣,在許多情況下可以降低與冷卻相關的能量成本。
液冷還有其他優(yōu)點,由于液體冷卻的效率,數(shù)據(jù)中心操作員可以更好地利用寶貴的占地面積,并增加每平方英尺的處理能力,并遠遠超過壓縮空氣通風所能達到的水平。液冷式處理器也運行得更冷,從而提高了性能,這是大量超級計算機用液體冷卻的主要原因。
圖 谷歌公司數(shù)據(jù)中心內(nèi)的液體冷卻TPU 3.0吊艙
大型數(shù)據(jù)中心的遷移遠離
據(jù)資料顯示,一般電力成本占整個大數(shù)據(jù)中心支出成本的50%-70%,而其中制冷過程消耗的電能又占數(shù)據(jù)中心所有功耗的40%。這是因為,一座數(shù)據(jù)中心會由數(shù)萬臺服務器組成,一般都是由電力提供動力,并且大量的服務器運轉時溫度升高需要散熱、降溫,也是由空調(diào)來完成冷卻功能,所以高耗能成本成為大數(shù)據(jù)中心的一大特點。
而像貴州貴陽市、寧夏中衛(wèi)市、內(nèi)蒙古烏蘭察布市這類地區(qū),全年平均溫度低于15度甚至是10度,同時都極少受到霧霾天氣的影響,PM2.5處于良好水平,空氣清新,這樣的空氣稍微過濾一下就可以直接進入機房,大大降低生產(chǎn)成本,因此可以使用自然散熱結合少量空調(diào)、風扇的方法,對設備進行冷卻。
并且上述地區(qū)均可以用清潔能源代替燃煤進行發(fā)電:貴州水資源豐富,水電裝機量排在全國第四位;寧夏與內(nèi)蒙古光照充足、大風天氣所占天數(shù)較多,因此太陽能、風能充沛,同樣可以降低企業(yè)耗能成本。這也就不難理解,為何亞馬遜會選擇在寧夏、騰訊選擇在貴州這類氣候涼爽的地區(qū)建立大數(shù)據(jù)中心。
圖 中國電信云計算內(nèi)蒙古信息園
地下數(shù)據(jù)中心悄然興起
實施重要的計算和存儲操作的數(shù)據(jù)中心所在的地點和位置。雖然數(shù)據(jù)中心在運營方面有很多風險,但任何風險評估都應從數(shù)據(jù)中心的位置開始,其位置可以保證這種敏感性,并且有時是專有業(yè)務功能的安全性和機密性。
企業(yè)可以通過在適合地理區(qū)域內(nèi)的地下建設數(shù)據(jù)中心設施,這樣的位置提供了任何地上建筑設施無法比擬的彈性。礦井內(nèi)的巖石為所有極端天氣和事件(包括龍卷風和颶風)創(chuàng)造了天然屏障,可以抵御全球各地的各種惡劣天氣。
地下數(shù)據(jù)中心鍵基礎設施可以在已知的更嚴格的參數(shù)范圍內(nèi)運行,從而實現(xiàn)最高的效率水平和性能。其冷卻系統(tǒng)不再需要調(diào)節(jié)從夏天8月的炎熱天氣到冬天1月零度以下的各種溫度。
從客戶的角度來看,自然冷卻的礦山環(huán)境非常有利于服務器機架和其他硬件的運營要求。因此,其冷卻能耗將會最小化,全年為客戶節(jié)省電能。
圖 騰訊公司在建的防空洞數(shù)據(jù)中心
海底數(shù)據(jù)中心獲微軟等巨頭青睞
2018年6月,微軟在蘇格蘭奧克尼群島海岸線附近的水域中部署了潛水艇式水下數(shù)據(jù)中心。微軟將一艘40英尺長的船沉入位于蘇格蘭近海的奧克尼群島海岸,該數(shù)據(jù)中心有12個機架,共有864臺服務器。微軟表示,它可以在無需維護的情況下保存數(shù)據(jù)和處理信息長達五年。
圖 微軟把數(shù)據(jù)中心沉入海底
微軟選擇建立水下數(shù)據(jù)中心的目的是提高近水地區(qū)的網(wǎng)絡速度,這些地區(qū)通常缺乏基礎設施。而視頻流和游戲需要更強大的基礎處理設施才能連接到互聯(lián)網(wǎng)。微軟英國首席執(zhí)行官辛迪羅斯周三表示:“全球近一半的人口生活在大片水域附近,讓數(shù)據(jù)中心離數(shù)十億網(wǎng)民更近將確保更快、更順暢的網(wǎng)絡瀏覽、視頻流和游戲,同時企業(yè)可以享受人工智能驅動的技術?!?/span>
利用海水、湖水降溫不止微軟一家。中國的阿里巴巴利用千島湖對服務器進行冷卻,這種方式也使其年均PUE低于1.3,最低可達到1.17。
AI控制環(huán)境參數(shù)在谷歌數(shù)據(jù)中心實踐
幾年前,谷歌通過旗下的DeepMind,開始研究如何利用機器學習更好地冷卻其數(shù)據(jù)中心。不過當時系統(tǒng)只是提出建議,而人工操作員則決定是否實施這些建議。
而近日,根據(jù)外媒報道,谷歌已經(jīng)通過AI來降低其數(shù)據(jù)中心的運營成本。最新的DeepMind建立起了足夠有用的模型,可以讓人工智能供電系統(tǒng)完全控制環(huán)境冷卻。新的冷卻系統(tǒng)已經(jīng)在一些谷歌的數(shù)據(jù)中心就位。每隔5分鐘,系統(tǒng)就會輪詢數(shù)據(jù)中心內(nèi)的數(shù)千個傳感器,并根據(jù)這些信息作出最佳操作。當然,這里有各種各樣的制衡機制,因此谷歌的一個數(shù)據(jù)中心因為這種???????制而陷入癱瘓的可能性很小。
圖 谷歌使用AI控制機房溫度的數(shù)據(jù)中心
DeepMind和大多數(shù)機器學習模型一樣,這個模型在收集了更多數(shù)據(jù)后會變得更好。與數(shù)據(jù)中心的歷史能源使用量相比,它現(xiàn)在平均能夠節(jié)省30%的能源。
值得注意的是,谷歌顯然是在試圖節(jié)省開支,但在很多方面,該公司也把這看作是一種推廣自己機器學習服務的方式。畢竟,能夠在數(shù)據(jù)中心起作用的東西也應該在大型辦公樓里起作用。DeepMind的工作人員在聲明中寫道:“從長遠來看,我們認為有可能將這項技術應用到其他工業(yè)領域,在更大規(guī)模的范圍內(nèi)幫助應對氣候變化?!?/span>
政策紅利多樣、市場需求旺盛、趨向規(guī)模發(fā)展,數(shù)據(jù)中心正在政府、企業(yè)、市場的多重因素推進下實現(xiàn)質與量的快速飛躍。近年來,不斷提升的機柜功率密度和數(shù)據(jù)中心節(jié)能降耗的需求推動數(shù)據(jù)中心的制冷方案朝密封通道和行級近端制冷的方向發(fā)展。同時,數(shù)據(jù)中心業(yè)務的實時性和高可靠性要求又對數(shù)據(jù)中心制冷設備提出高可靠、易維護的要求。
可以預見,未來的機房空調(diào)市場前景廣闊,低能耗、高運行穩(wěn)定性、冷卻效率更高、更加節(jié)省空間的產(chǎn)品將更加契合客戶需求,獲得市場青睞。