“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0

12月2日,在加拿大舉行的第32屆NIPS神經信息處理系統(tǒng)大會上,百度正式發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0。該平臺專為AI深度學習場景優(yōu)化設計,每秒完成2000萬億次深度神經網絡計算,極大的加快了AI深度學習模型的訓練速度。

NIPS作為機器學習和神經計算領域的頂級會議,吸引了機器學習、人工智能、統(tǒng)計等領域的眾多國際專家參與。近年來,在計算機視覺、語音識別、自然語言處理等領域也出現(xiàn)了大量的創(chuàng)新應用,NIPS在AI深度學習領域的學術影響力變得舉足輕重。



“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


算法、數(shù)據和計算是推動AI深度學習技術快速發(fā)展的三大要素。為支持更強的泛化能力,更高的預測精度,算法模型日趨復雜,越來越多的數(shù)據需要被及時標注和處理,計算性能成為關鍵。百度X-MAN超級AI計算平臺提供極致的計算性能,支持超大復雜算法模型,能夠快速及時處理海量數(shù)據。自2016年誕生以來,百度X-MAN超級AI計算平臺歷經3代發(fā)展,3次架構升級,創(chuàng)造6項業(yè)界第一,同時期關鍵技術&性能保持領先,引領行業(yè)發(fā)展趨勢。目前,X-MAN系列產品已在百度大規(guī)模應用,正在助力百度AI戰(zhàn)略快速落地。


“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


X-MAN解決的3大關鍵技術挑戰(zhàn)

為提供更強的計算性能和最佳的計算效率,X-MAN在系統(tǒng)設計中面臨了三大關鍵技術的挑戰(zhàn):如何有效提升單機計算性能、如何實現(xiàn)多機加速的高可擴展性以及如何均衡CPU與AI加速芯片的配比關系,以避免系統(tǒng)瓶頸。

在有限的單機空間內,集成更多數(shù)量、性能更強、互聯(lián)帶寬更高的AI加速卡,是提升單機計算性能的直接手段,但帶來了高速互聯(lián)、結構、散熱、供電等硬件技術難題;單機訓練方式難以滿足超大規(guī)模數(shù)據集和復雜的模型場景下的計算力需求,大規(guī)模分布式訓練成為必然,解決多機加速的可擴展性就成了關鍵技術難題;深度學習模型的負載差異較大,CPU密集型,計算密集型,通信密集型,存在著多種需求場景,為了避免系統(tǒng)性能瓶頸、充分發(fā)揮計算效率,如何快速靈活的調整CPU和AI計算芯片的配比并支持獨立迭代升級成了關鍵的技術難題。

X-MAN的3次架構升級和9大技術特征

自2016年首次發(fā)布以來,X-MAN的三代產品各自都有著鮮明的設計理念:超高的計算密度、高效散熱、兼容多元化AI加速芯片。X-MAN通過3次架構升級,有效攻克了3大技術挑戰(zhàn)。

X-MAN1.0發(fā)布于2016年Q2,單機可以支持16個AI加速卡,最高擴展到64,實現(xiàn)了超高的計算密度。X-MAN1.0具備4大技術特征:硬件解耦、資源池化、PCIe Fabric技術、100G RDMA高速互聯(lián)。

X-MAN2.0發(fā)布于2017年Q3,通過冷板式液冷散熱技術實現(xiàn)了超高的散熱效率。和業(yè)界主流方案一樣,X-MAN2.0可以支持8卡NVLink高速互聯(lián),差異化方面,X-MAN2.0具備2大技術特征:液冷散熱和靈活的IO支持。

隨著AI人工智能技術的快速發(fā)展,眾多AI芯片公司應運而生,AI芯片格局正呈現(xiàn)多元化發(fā)展趨勢。此次NIPS大會上發(fā)布的X-MAN3.0,采用了硬件系統(tǒng)模塊化、互聯(lián)接口標準化、互聯(lián)拓撲高靈活性的設計思路,既提升了多元化AI加速芯片的兼容性,也促進了AI加速芯片生態(tài)健康、快速、可持續(xù)的發(fā)展。X-MAN3.0具備3大關鍵技術特征,包括48V供電技術、標準化的AI加速卡接口定義和靈活的互聯(lián)拓撲。

此次百度快速研發(fā)落地X-MAN3.0,得到了浪潮、英業(yè)達等服務器系統(tǒng)廠商的積極參與支持; 我們期待有更多的服務器系統(tǒng)合作伙伴、AI加速芯片廠商和同行加入共建開放的生態(tài),促進整個生態(tài)圈的良性發(fā)展。


“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


X-MAN1.0

“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


X-MAN2.0

“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0


X-MAN3.0

X-MAN創(chuàng)造了6項業(yè)界第一,引領行業(yè)技術發(fā)展趨勢

憑借著對AI業(yè)務模型的深刻理解、扎實的硬件基礎架構技術和對行業(yè)趨勢的準確預判,百度設計了X-MAN AI計算平臺系列產品,創(chuàng)造了6項業(yè)界第一。其中, 2016年Q2發(fā)布的X-MAN1.0創(chuàng)造了5個業(yè)界第一:首次實現(xiàn)單機擴展16片AI加速卡;首次實現(xiàn)4/8/16/32/64卡系統(tǒng)級彈性擴展;首次實現(xiàn)AI計算硬件解耦架構(注:Facebook 2017年Q1發(fā)布的Big Basin、微軟2017年Q1發(fā)布的HGX-1等都采用了相似設計理念);首次實現(xiàn)PCIe Fabric技術架構,支持按需求業(yè)務動態(tài)分配AI計算資源;首次實現(xiàn)虛擬機多卡高速無損通信技術(native performance)。2017年Q3發(fā)布的X-MAN2.0業(yè)界首創(chuàng)將冷板式液冷散熱技術應用到AI計算產品里,有效解決了高性能AI加速卡的散熱挑戰(zhàn)(注:Google 2018年Q2發(fā)布的TPU3.0也采用了相似技術)。

X-MAN大規(guī)模部署,助力百度AI戰(zhàn)略快速落地

憑借著強大的單機計算性能、業(yè)界領先的多機擴展性、靈活的AI計算資源動態(tài)分配調整能力,X-MAN系列產品已在百度實現(xiàn)規(guī)?;渴?,廣泛應用于語音識別、計算機視覺、自然語音處理、無人車等基礎AI技術的深度學習模型訓練,將訓練時間從周級別縮短到天級別;服務于百度DuerOS、Apollo、ABC Cloud等核心業(yè)務,助力百度AI戰(zhàn)略的快速落地。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-12-03
“X戰(zhàn)警”到來,百度重磅發(fā)布自主研發(fā)的超級AI計算平臺X-MAN3.0
該平臺專為AI深度學習場景優(yōu)化設計,每秒完成2000萬億次深度神經網絡計算,極大的加快了AI深度學習模型的訓練速度。

長按掃碼 閱讀全文