DeepSeek的橫空出世,將人工智能帶入了深思考的時代,讓AI突破 “次元壁”,成為指數(shù)級增長的全民需求。這不僅加速了AI行業(yè)的滲透速度,也令算力迎來了一輪新的挑戰(zhàn)。
在全新的時代,智算中心無疑扮演著關(guān)鍵角色,為AI計算提供源源不斷的算力支持。隨著AI技術(shù)的飛速發(fā)展,智算中心正逐步取代傳統(tǒng)數(shù)據(jù)中心,這一轉(zhuǎn)變對網(wǎng)絡(luò)傳輸系統(tǒng)帶來了全新的變革與挑戰(zhàn)。
智算中心與傳統(tǒng)數(shù)據(jù)中心有何不同?智算中心需要什么樣的網(wǎng)絡(luò)架構(gòu)?
日前,Aginode安捷諾(原耐克森通訊系統(tǒng))亞太區(qū)產(chǎn)品總監(jiān)王君原,受邀參與了“算力百人會”線上直播活動,與相關(guān)專家圍繞“智算中心時代網(wǎng)絡(luò)布線的黃金法則與測試挑戰(zhàn)”的議題進行了廣泛交流,對智算中心網(wǎng)絡(luò)架構(gòu)建設(shè)提供了“思想坐標”。
從通算到智算:布線的顛覆性變革
在AI技術(shù)的驅(qū)動下,尤其是大模型需求的持續(xù)高漲,傳統(tǒng)的數(shù)據(jù)中心正加速向智算中心轉(zhuǎn)型升級。當通算向智算轉(zhuǎn)變時,數(shù)據(jù)中心建設(shè)以及網(wǎng)絡(luò)架構(gòu)發(fā)生了根本性變化。
首先,智算將數(shù)據(jù)中心從信息/數(shù)據(jù)計算棧和中轉(zhuǎn)站變?yōu)锳I工廠,自動化、規(guī)模化訓(xùn)練和推理AI模型,而且數(shù)據(jù)傳輸?shù)目煽啃灾苯佑绊懮a(chǎn)力,網(wǎng)絡(luò)/算力運行效率與成本直接掛鉤。信息延時的零容忍是智算跟通算的主要區(qū)別之一。
其次,由于智算中心引入了新的計算架構(gòu),其迭代速度更快,同時設(shè)備與設(shè)備之間的互聯(lián)密度更高,因此,智算中心對于網(wǎng)絡(luò)速率的需求遠大于通算中心,需要更高速率、更低時延、更大帶寬、更高效率的網(wǎng)絡(luò)傳輸以及網(wǎng)絡(luò)連接。
布線面臨哪些挑戰(zhàn):高效運維是關(guān)鍵點之一
對于智算中心需不需要布線的問題,需要明確了解“解決復(fù)雜互聯(lián)的問題”是布線的核心價值。那么,隨著智算中心的興起,其布線在網(wǎng)絡(luò)架構(gòu)、連接距離、升級路徑、運維成本等維度面臨挑戰(zhàn)。
在智算中心的網(wǎng)絡(luò)架構(gòu)中,通常會引入Super Spine層,確保每個計算面,如參數(shù)面、數(shù)據(jù)面和存儲面之間的互聯(lián)互通,由于網(wǎng)絡(luò)架構(gòu)規(guī)模變大,所以如何降低延遲、如何確保網(wǎng)絡(luò)的傳輸穩(wěn)定,成為網(wǎng)絡(luò)架構(gòu)設(shè)計的關(guān)鍵。
智算中心的網(wǎng)絡(luò)速率已經(jīng)有了飛速的提升,400G、800G甚至未來的1.6T/3.2T,網(wǎng)絡(luò)速率的不斷提升對布線系統(tǒng)提出了更高的要求。如何選擇合適的收發(fā)器方案、確保多芯MPO的兼容性和穩(wěn)定性、如何測試多芯MPO,成為智算中心布線設(shè)計的重要考量。針對MPO16芯,提倡統(tǒng)一采用APC接口以及Key Up/Key Down適配器。
在智算中心中,網(wǎng)絡(luò)傳輸?shù)挠行苑€(wěn)定性,直接關(guān)系到AI模型的訓(xùn)練和推理效率,是與智算中心成本直接掛鉤的重要指標,因此,高效的運維是智算中心的關(guān)鍵點之一。在柜內(nèi)提升DAC用量,以及采用有效的備品備件策略保障迅速替換,是應(yīng)對智算中心運維挑戰(zhàn)的有效策略。
布線不只是架構(gòu)設(shè)計:高效的管理更重要
布線系統(tǒng)作為智算中心的基礎(chǔ)設(shè)施,對關(guān)鍵網(wǎng)絡(luò)的穩(wěn)定運行起著至關(guān)重要的作用。在建設(shè)中,需要基于邏輯思維原則,采用“端口標識-記錄存檔-下派工單-現(xiàn)場作業(yè)-更新存檔” 的閉環(huán)管理方式,在長時間運維過程中,實現(xiàn)對端口的高效管理。所以,布線不只是產(chǎn)品和架構(gòu)的設(shè)計,也是通過運維的理念更有效地管理關(guān)鍵網(wǎng)絡(luò)。
在通過按需采用適用的直連vs結(jié)構(gòu)化布線形式,為各計算面互聯(lián)提供靈活性,并采用穩(wěn)定可靠的部件、超低損耗類產(chǎn)品的基礎(chǔ)上,采用系統(tǒng)的標簽標識、工單化、軟件化、自動化策略的管理方案,以網(wǎng)絡(luò)形式實現(xiàn)對智算中心互聯(lián)的管理。同時,優(yōu)化生產(chǎn)、測試流程也是提升網(wǎng)絡(luò)運維效率的關(guān)鍵要素,而且重視安裝現(xiàn)場管理、測試是實現(xiàn)整個網(wǎng)絡(luò)有效管理的前提條件。
豐富行業(yè)經(jīng)驗:賦能智算時代網(wǎng)絡(luò)架構(gòu)
作為全球領(lǐng)先的通信與數(shù)據(jù)解決方案提供商,Aginode安捷諾在高端基礎(chǔ)設(shè)施解決方案的開發(fā)、部署和服務(wù)方面積累了超過30年的行業(yè)經(jīng)驗,擁有先進的工業(yè)足跡,以及豐富的行業(yè)經(jīng)驗和被市場認可的技術(shù)傳承。
面對智算中心對網(wǎng)絡(luò)架構(gòu)帶來的變革和挑戰(zhàn),Aginode安捷諾基于深厚的研發(fā)和創(chuàng)新優(yōu)勢,能夠提供從設(shè)計、生產(chǎn)到運維的全鏈條解決方案,致力于幫助客戶構(gòu)建高效、穩(wěn)定、可靠的智算中心網(wǎng)絡(luò)。
智算中心的崛起標志著算力經(jīng)濟的全面爆發(fā),而網(wǎng)絡(luò)基礎(chǔ)設(shè)施作為其“神經(jīng)網(wǎng)絡(luò)”,正經(jīng)歷前所未有的技術(shù)革新。Aginode安捷諾將持續(xù)聚焦“安全可靠、敏捷高效、信守承諾”的品牌內(nèi)核,通過技術(shù)迭代賦能數(shù)字化基礎(chǔ)設(shè)施,推動數(shù)字社會邁向智慧互聯(lián)的未來。
關(guān)于Aginode安捷諾(原耐克森通訊系統(tǒng))
Aginode安捷諾(原耐克森通訊系統(tǒng)),在FTTx、移動網(wǎng)、局域網(wǎng)和數(shù)據(jù)中心領(lǐng)域設(shè)計、制造和銷售數(shù)字化網(wǎng)絡(luò)連接解決方案?;?00多年的歷史,我們的目標是無論在當下還是未來,讓網(wǎng)絡(luò)基礎(chǔ)設(shè)施能夠承載更多的應(yīng)用程序,讓生活更加互聯(lián)、更加高效、更加愉悅。Aginode安捷諾的全球總部位于法國巴黎,亞太總部位于中國上海,在歐洲、中東、北非和亞洲擁有8家工廠。如需了解更多信息,歡迎訪問www.aginode.net。