omniture

浪潮存儲 為中汽創(chuàng)智自動駕駛訓練提速

2021-11-11 17:45 4597

北京2021年11月11日 /美通社/ -- 中汽創(chuàng)智科技有限公司由中國一汽、東風公司、長安汽車、南京江寧經開科技等企業(yè)共同出資160億元設立,落戶南京江寧經濟技術開發(fā)區(qū)。

中汽創(chuàng)智選擇浪潮分布式存儲AS13000G5系列的M和H節(jié)點,構建了自動駕駛訓練模型,進一步提升GPU集群自動駕駛模型訓練過程中的數據讀寫速度,大大加快研發(fā)速度。

中汽創(chuàng)智科技有限公司的成立,是落實制造強國、科技強國、汽車強國等國家戰(zhàn)略的重要舉措。央企新能源汽車整車領域的產業(yè)投資、技術研發(fā)將集中在中汽創(chuàng)智,有利于推動產業(yè)資源整合和開放合作,加快在制約當前產業(yè)發(fā)展的“卡脖子”技術和下一代關鍵核心技術領域的集中攻關和突破。中汽創(chuàng)智聚焦智能底盤、氫燃料動力、智能網聯三大業(yè)務領域,致力于成為汽車行業(yè)技術創(chuàng)新的引領者、產業(yè)孵化的踐行者、數據服務的驅動者。

部署自動駕駛訓練平臺,推進自動駕駛技術發(fā)展

中汽創(chuàng)智計劃建設一套自動駕駛模型訓練平臺。借助平臺的運算能力和存儲能力,為自動駕駛、人工智能等領域相關技術的研發(fā),提供IT資源支撐。

模型訓練需要頻繁在存儲設備中讀寫數據,對存儲系統性能要求較高,原始模型開發(fā)的過程中需要調用TB級的圖片數據集,且模型在開發(fā)的過程中也會產生很多中間數據需要存儲。

除了數據讀寫和大量圖片的處理,中汽創(chuàng)智自動駕駛訓練模型的搭建還給數據傳輸帶來挑戰(zhàn),傳統存儲在面對數據短時間內增長迅速,傳統硬盤效率低,無法發(fā)揮數據的及時性和準確性。

浪潮AS13000-H,如何HOLD住海量數據?

浪潮為中汽創(chuàng)智提供了高性能AS13000G5-H型號和13000G5-M存儲組合方案。提供了不低于50GB/s的聚合帶寬和PB級存儲空間,滿足了自動駕駛訓練模型對大量圖片處理和數據頻繁讀寫的需求。助力中汽創(chuàng)智自動駕駛訓練模型平臺的建設。

浪潮AS13000-H分布式文件存儲系統采用元數據節(jié)點與數據節(jié)點分離的網絡架構,元數據與數據的讀寫互不影響。同時,AS13000-H的軟件系統面向小文件進行了專門的調優(yōu)和設計,使得AS13000-H更加適合圖片數據集訓練這種小文件頻繁讀寫的場景。從而進一步提升GPU集群自動駕駛模型訓練過程中的數據讀寫速度,推薦配置2個元數據節(jié)點和2個數據節(jié)點。元數據節(jié)點之間,數據節(jié)點之間開啟鏡像模式,實現元數據和數據的兩副本存儲,通過雙副本機制,保障中汽創(chuàng)智自動駕駛模型訓練過程中數據的安全。每臺元數據節(jié)點和數據節(jié)點均配有2套網絡。一套為10Gb萬兆以太網絡,接入業(yè)務交換機,實現研發(fā)人員和管理人員對于存儲設備的前端接入和訪問。另外一套為100Gb EDR Infiniband網絡,接入集群內部用于數據交換的IB交換機,實現模型訓練過程中計算節(jié)點與存儲節(jié)點之間的數據讀寫,最大化保障數據傳輸效率。

考慮到用于模型訓練的圖片數據集及部分中間結果需要在開發(fā)機之間共享,因此,存儲設備應具備共享網盤功能,以便不同開發(fā)機之間對同一份訓練數據集進行讀寫,并對中間結果進行共享。浪潮存儲采用3臺4U36盤位存儲服務器構成分布式存儲系統的硬件平臺;軟件層面,使用經過浪潮商業(yè)化開發(fā)的Ceph文件系統。通過軟件定義存儲技術,將3臺存儲服務器定義為一臺分布式存儲系統。該系統可以同時支持文件、對象、塊三種存儲類型,本項目中使用文件存儲格式進行開發(fā)及存儲環(huán)境搭建,幫助用戶實現對存儲資源的最大化利用,有效降低存儲開銷,實現高效數據存取和維護,確保數據安全可靠。

目前,中汽創(chuàng)智自動駕駛訓練模型平臺已經全面投入使用,在智能座艙、仿真與測試、自動駕駛等多個業(yè)務中開展大數據分析和高性能訓練,與中汽創(chuàng)智的云平臺進行對接,形成統一的數據中心級別的大平臺。

消息來源:浪潮
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯網、科技、媒體、通訊企業(yè)的經營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection