第一個(gè)圍繞與AI相關(guān)的異構(gòu)計(jì)算跟大家做分享,這里我會(huì)邀請(qǐng)嘉賓共同組成分享的環(huán)節(jié)。

首先我先代表百度跟大家做一個(gè)分享,百度怎么樣用一些創(chuàng)新的解決方案支持AI業(yè)務(wù)的發(fā)展。2012年底百度成立深度學(xué)習(xí)研究院,專(zhuān)門(mén)從事跟AI相關(guān)的研究。再后來(lái)我們做了無(wú)人車(chē),發(fā)布了阿波羅無(wú)人車(chē)開(kāi)放平臺(tái)等等。我們發(fā)現(xiàn)要解決AI的問(wèn)題,還是要從最根本的需求著手。我們構(gòu)想設(shè)計(jì)出一個(gè)更好的能夠適應(yīng)AI訓(xùn)練需求的設(shè)計(jì),我們把這個(gè)項(xiàng)目稱(chēng)之為X-Man。核心邏輯是左邊這張架構(gòu)圖,不只是一個(gè)system的拓?fù)洌钦麄€(gè)異構(gòu)計(jì)算的拓?fù)?。在這個(gè)拓?fù)淅镂覀儤?gòu)想的是通過(guò)PCIe的交換方式,把更多的計(jì)算節(jié)點(diǎn)和后面異構(gòu)計(jì)算的模塊進(jìn)行整合,這個(gè)也很好的匹配了天蝎3.0所謂的資源解耦合的設(shè)計(jì)理念。在這個(gè)設(shè)計(jì)里,通過(guò)PCIE switch,構(gòu)建一個(gè)異構(gòu)計(jì)算的計(jì)算資源池,很好的適應(yīng)大數(shù)據(jù)大模型的計(jì)算場(chǎng)景。通過(guò)這樣的設(shè)計(jì)比較好的解決了訓(xùn)練的問(wèn)題,基于Inference的需求變得更大,現(xiàn)在行業(yè)里變成共識(shí),在未來(lái)的三五年,整個(gè)Inference的需求量規(guī)模是高出一個(gè)數(shù)量級(jí)甚至更多。在云端,百度X-Man設(shè)計(jì)最大的好處是異構(gòu)垂直的計(jì)算跟前端的計(jì)算是解耦合的。X-Man 2.0可以更好的支持下一代的GPU或者FPGA設(shè)計(jì),可以支持NV-Link和PCIe,設(shè)計(jì)里增加了對(duì)液冷的支持,這個(gè)產(chǎn)品很快也會(huì)公布。這是我想跟大家分享的百度怎么樣用一個(gè)新的設(shè)計(jì)????構(gòu)來(lái)解決AI計(jì)算層面的問(wèn)題。
我的分享到這里,謝謝。

