国产精品视频网址|久久机热国产自偷自|欧美一级中文一级|久久久无码日韩视频|欧美午夜激情影院|成人av不卡网站|色吧加勒比一本道东京热成人无码在线|欧美 亚洲 偷情|欧美老妇乱一区二区|亚洲一区二区网站

AMD Alveo? V80發(fā)布!為內存密集型工作負載提供強大加速

AMD Alveo? V80加速卡是AMD推出的首款大規(guī)模市場化的加速卡產品,采用了Versal FPGA自適應SoC,為大數(shù)據(jù)集提供FPGA靈活性與HBM,適用于處理計算密集型和內存密集型的工作負載

近日,AMD發(fā)布了全新Alveo? V80加速卡,專為內存密集型工作負載提供靈活應變的加速。

4

據(jù)AMD自適應和嵌入式計算事業(yè)部(AECG)高級產品線經(jīng)理Shyam Chander介紹,Alveo? V80加速卡是AMD推出的首款大規(guī)模市場化的加速卡產品。它采用了Versal FPGA自適應SoC,為大數(shù)據(jù)集提供FPGA靈活性與HBM,適用于處理計算密集型和內存密集型的工作負載,主要服務于高性能計算、數(shù)據(jù)分析、金融科技、存儲等領域。

與前代產品相比,Alveo? V80的性能能提升至高2倍,并且邏輯密度翻倍,存儲器帶寬翻倍,存儲器的性能也有很大的提升。另外,Alveo? V80提供了非常熟悉的FPGA開發(fā)流程,有AMD的Vivado?工具設計框架可以用于Alveo硬件,可以幫助客戶更好地部署。目前,Alveo? V80加速卡已投入量產。

AMD Alveo? V80加速卡:為計算密集型工作負載解決內存與帶寬挑戰(zhàn)

隨著高性能計算、數(shù)據(jù)分析、網(wǎng)絡安全、傳感器處理、計算存儲和金融科技等領域對內存密集型工作負載的需求日益增長,這些應用通常涉及大型數(shù)據(jù)集,并要求硬件具備足夠的靈活性以適應工作負載的優(yōu)化需求。

1

傳統(tǒng)的大數(shù)據(jù)集工作負載處理流程示意圖

傳統(tǒng)的大數(shù)據(jù)集工作負載處理流程往往在存儲器和網(wǎng)絡訪問方面容易遇到瓶頸,在高性能計算等應用場景中也不例外。

首先,在內存方面,無論是DDR4還是DDR5,帶寬非常有限,無法和PCIe相媲美,經(jīng)常達不到CPU、FPGA等各種芯片、計算傳輸?shù)男枨蟆F浯?,在網(wǎng)絡方面,傳統(tǒng)方案往往是固定網(wǎng)絡接口與帶寬,一旦需要超大規(guī)模數(shù)據(jù)傳輸,就難以滿足。因此,解決計算密集型工作負載內存與帶寬的挑戰(zhàn)成為AMD 研發(fā)Alveo? V80的重要一環(huán)。

AMD AlveoTM V80

AMD Alveo? V80的大數(shù)據(jù)集工作負載處理流程示意圖

AMD Alveo? V80加速卡基于7nm Versal?自適應SoC架構,并配備了高帶寬存儲器 (HBM),不再需要DDR4或其他外部芯片,打破了傳統(tǒng)的大數(shù)據(jù)集工作負載在內存與網(wǎng)絡訪問的局限,把安全連接和靈活應變的計算融合,可以幫助用戶實現(xiàn)性能最大化,同時減少功耗、占板面積以及時延。

此外,AMD Alveo? V80融合了FPGA的靈活應變來處理大數(shù)據(jù)集的工作負載。與前代產品相比,它的性能提升至高2倍,包括邏輯密度翻倍、存儲器帶寬翻倍。并且,Alveo? V80支持使用AMD Vivado? Design Suite的傳統(tǒng)FPGA設計流程,使得開發(fā)人員可以更加容易地利用這款加速器卡。

基于對提升邏輯密度、存儲器帶寬和網(wǎng)絡帶寬的著重設計,AMD Alveo? V80加速卡能夠有效處理多種大數(shù)據(jù)工作負載,涵蓋了從高性能計算(如基因組學和傳感器數(shù)據(jù)處理)、數(shù)據(jù)分析(例如欺詐檢測)、金融科技(包括風險分析和算法交易)、網(wǎng)絡安全(如數(shù)據(jù)包檢查)到存儲(其中數(shù)據(jù)壓縮尤為關鍵)等多個領域。此外,它在AI計算領域也表現(xiàn)出色,支持推薦引擎和大型語言模型等應用。因此,Alveo? V80能夠幫助客戶顯著提升這些工作負載的處理速度,優(yōu)化數(shù)據(jù)處理流程,提升整體工作效率。

AMD Alveo? V80:滿足大規(guī)模加速內存密集型工作負載

作為Versal HBM系列中最大的器件,AMD Alveo? V80采用全高、3/4 長( FH?L )尺寸規(guī)格,由 AMD Versal? HBM 自適應SoC提供支持,整體包含一個32GB的DDR4 DIMM擴展插槽、能夠提供250萬個LUT的可編程邏輯、10,890個DSP計算邏輯片以及820GB/s的存儲器帶寬。 Alveo? V80還采用了PCIe Gen5接口,支持64G的傳輸速率,并支持MCIO的連接,有可擴展的GTY,可以實現(xiàn)存儲卡的一系列連接。

AMD AlveoTM V80加速卡

AMD Alveo? V80加速卡整體架構

Shyam Chander表示, Alveo? V80芯片的關鍵特點包括其超高的帶寬,集成了高帶寬網(wǎng)絡核心和加密引擎。其次,它配備了大量的DSP計算邏輯片,提供比前代產品高達2到3倍的DSP性能。此外,V80還具備硬化的計算基礎設施連接,即所謂的超級通道,這使得集成過程更加輕松便捷。

據(jù)了解,預構建、硬化的數(shù)據(jù)中心基礎設施連接正是使用了V80加速卡來實現(xiàn)這種硬化的Versal連接,可以非常方便地連接板載擴展內存、以太網(wǎng)絡、MCIO端口,以及高性能的EPYC處理器。

預構建、硬化的數(shù)據(jù)中心基礎設施的連接

AMD Alveo? V80硬化的計算基礎設施連接

Shyam Chander通過列舉了AMD Alveo? V80在澳大利亞聯(lián)邦科學與工業(yè)研究組織天文天線陣列和在金融科技方面的應用案例,說明了V80計算加速卡在高性能計算、AI、數(shù)據(jù)中心等應用領域的優(yōu)勢。

聯(lián)邦科學與工業(yè)研究組織CSIRO是澳大利亞國家級研究機構,參與了世界最大射電天文天線陣列的建設。該陣列目前包含420塊Alveo U55C加速卡,主要通過處理無線電波來研究早期宇宙并探索信息演化。該陣列持續(xù)傳感器數(shù)據(jù)傳輸速度能達到每秒15TB,工作負載主要是傳感器的實時傳輸還有波束成型和連接器。

由于工作負載主要涉及DSP,CSIRO的工作負載就愈發(fā)復雜,不僅需要迅速擴展計算資源,而且需要在有限的機架空間內優(yōu)化設備布局,以便數(shù)據(jù)中心能夠容納更多的設備。在這個過程中,還需要支持不斷提高的計算功耗和功能靈活性需求。簡而言之,在相近的總擁有成本下,目標是在相近的總擁有成本下,實現(xiàn)比前代產品高出三倍的算力,同時考慮到有限的機架空間限制。

因此,CSIRO選擇了V80計算加速卡來提升計算性能,并增強Versal上的DSP引擎,以降低時延并實現(xiàn)高精度的實時工作負載。而DSP58相關功能得到了顯著增強,其強化的Versal DSP計算邏輯片相較于前代產品,性能提升了大約2到3倍。并且每張卡的密集計算簡化了集成、擴展和集群的部署過程。

2

傳感器處理擴展算力及總擁有成本降低的估算情況

金融建模和算法交易是金融科技領域的兩個重要應用。AMD Alveo? V80為金融科技領域提供了強大的技術支持,能夠處理復雜的金融模型和算法交易,同時確保了數(shù)據(jù)處理的高速度和準確性。

一方面,建模仿真和回測的用例依賴于密集計算架構和DSP,主要在FPGA上實現(xiàn),而HBM被用于處理大數(shù)據(jù)集和歷史定價數(shù)據(jù)。另一方面,低時延算法交易用例體現(xiàn)在加速交易策略和期權定價的過程。此外,還有752Mb的RAM用于存儲定價數(shù)據(jù)和交易記錄。同樣,HBM也用于處理訂單信息。

3

金融建模和算法交易案例

正如Shyam Chander所說,AMD計算加速卡采用的自適應SoC架構能夠在計算和存儲器帶寬方面提供非常高的性價比,Versal系列產品能夠給客戶提供包括邏輯資源和低時延、可擴展性、能效、存儲器、帶寬等各方面的價值,而Alveo? V80可以應對非常廣泛的工作負載和需求。

相關推薦

發(fā)表評論