浪潮中標(biāo)華中師大建NVLink V100千萬億次AI超算

2017-11-17 11:05 9863

近日，浪潮中標(biāo)華中師范大學(xué)，將為其設(shè)計(jì)建造基于“NVLink+Volta”的千萬億次超級計(jì)算機(jī)，加速物理前沿科學(xué)和自動(dòng)駕駛AI技術(shù)研究。

北京2017年11月17日電 /美通社/ -- 近日，浪潮中標(biāo)華中師范大學(xué)，將為其設(shè)計(jì)建造基于“NVLink+Volta”的千萬億次超級計(jì)算機(jī)，加速物理前沿科學(xué)和自動(dòng)駕駛AI技術(shù)研究。

這套系統(tǒng)將采用18套浪潮AGX-2超算服務(wù)器作為計(jì)算節(jié)點(diǎn)，配置144塊Nvidia最新支持NvLink 2.0的Volta架構(gòu)V100芯片，采用最新的Intel Xeon SP (Skylake)處理器，通過Mellanox EDR Infiniband網(wǎng)絡(luò)進(jìn)行高速互聯(lián)，運(yùn)行浪潮ClusterEngine及AIStation等集群管理套件，系統(tǒng)雙精度浮點(diǎn)性能超過千萬億次每秒(1PetaFlops)。由于采用了NVLink2.0高速互聯(lián)技術(shù)和Tesla® V100 GPU，該系統(tǒng)將可同時(shí)很好支持科學(xué)工程計(jì)算和AI計(jì)算。

浪潮AGX-2是全球首款在2U空間內(nèi)高速互聯(lián)集成8顆較高性能GPU的服務(wù)器，在2U空間內(nèi)支持部署8塊NVLink 2.0接口的NVIDIA Tesla® V100 GPU，GPU間單向互聯(lián)帶寬高達(dá)150GB/s，總帶寬達(dá)300GB/s。同時(shí)， AGX-2具備良好的I/O擴(kuò)展能力，提供8塊NVMe/SAS/SATA熱插拔硬盤,可支持最多4塊100Gbps的EDR InfiniBand接口卡的高速集群互聯(lián)，不僅支持通常的風(fēng)冷散熱方式，還可支持片上水冷以提供更高的計(jì)算能效比。

AGX-2可以極大提升HPC應(yīng)用計(jì)算效率，其單機(jī)雙精度浮點(diǎn)計(jì)算性能突破60萬億次每秒。以凝聚態(tài)物理學(xué)和材料科學(xué)領(lǐng)域廣泛使用的VASP軟件為例，在AGX2上使用1塊P100 GPU加速卡，即可達(dá)到使用8臺雙路主流CPU計(jì)算集群的性能，同時(shí)，AGX2提供的Nvlink高通信帶寬使其在多GPU卡并行效率上有出色表現(xiàn)，4塊P100 GPU卡并行即可達(dá)到近20臺雙路主流CPU計(jì)算集群的性能。

在AI計(jì)算上，AGX-2搭載的Tesla V100 配備了深度學(xué)習(xí)高度相關(guān)的Tensor 單元，Tensor 性能可以達(dá)到 120 TFLOPS，配合NVLink 2.0可極大提升深度學(xué)習(xí)框架的訓(xùn)練性能?；趪H通用的Imagenet數(shù)據(jù)集進(jìn)行深度學(xué)習(xí)模型訓(xùn)練，浪潮AGX-2上表現(xiàn)出優(yōu)異性能，配置8片V100時(shí)在TensorFlow框架的GoogleNet模型訓(xùn)練速度達(dá)到每秒1898張圖片，是單卡性能的7倍，是同數(shù)量配置P100系統(tǒng)性能的1.87倍。

消息來源：浪潮集團(tuán)