3月2日,海淀區(qū)傳來(lái)好消息——北京人工智能公共算力平臺(tái)再次擴(kuò)容,智算規(guī)模突破10000P,成為北京最大、國(guó)內(nèi)領(lǐng)先的超大規(guī)模高性能單體智算集群,將有力支撐各類創(chuàng)新主體萬(wàn)億參數(shù)級(jí)通用基礎(chǔ)大模型一體化訓(xùn)練和推理。
北京人工智能公共算力平臺(tái)機(jī)房一角
北京人工智能公共算力平臺(tái)2023年9月15日啟動(dòng)建設(shè),2024年3月點(diǎn)亮3500P規(guī)模的高性能算力集群,如今突破10000P(相當(dāng)于500萬(wàn)臺(tái)高性能筆記本計(jì)算機(jī)的計(jì)算能力),可以高效地運(yùn)用在大模型訓(xùn)練推理、大數(shù)據(jù)分析、科研教育、自動(dòng)駕駛等領(lǐng)域。
中關(guān)村科學(xué)城管委會(huì)相關(guān)負(fù)責(zé)人介紹,突破10000P的北京人工智能公共算力平臺(tái)通過(guò)頂層統(tǒng)一架構(gòu)設(shè)計(jì),實(shí)現(xiàn)了效率、穩(wěn)定性和可擴(kuò)展性等多維度突破。集群跨節(jié)點(diǎn)信息傳輸?shù)乃俣群蜏?zhǔn)確性較傳統(tǒng)方案提升40%,能大幅提升萬(wàn)億參數(shù)模型訓(xùn)練效率,還構(gòu)建了全鏈路監(jiān)測(cè)和故障自愈系統(tǒng),可提前預(yù)測(cè)判斷硬件潛在故障,保障全年訓(xùn)練任務(wù)完成率超過(guò)99%。而且單一集群算力的資源池能徹底規(guī)避多集群通信損耗,有效助力企業(yè)從算力困境中突圍,專注攻克核心技術(shù)壁壘。
來(lái)源:北京日?qǐng)?bào)客戶端