北京2024年1月24日 /美通社/ -- 業(yè)界首部《全液冷冷板系統(tǒng)參考設計及驗證白皮書》現(xiàn)已正式開放下載,該白皮書由浪潮信息、英特爾、OCTC開放計算標準工作委員會、全國信息技術標準化技術委員會算力標準工作組、中國電子技術標準化研究院聯(lián)合撰寫,詳細解讀了液冷技術的背景、技術優(yōu)化方向以及全液冷冷板系統(tǒng)的設計、驗證和展望,為全液冷冷板服務器設計和規(guī)模應用中面臨的主要難點提供了創(chuàng)新設計參考,對全液冷冷板技術在通用架構上實現(xiàn)快速導入和推廣具有重要指導意義。
主流中的前沿——全液冷冷板技術
目前,冷板式液冷由于在產業(yè)鏈成熟度、改造成本、可維護性、兼容性等方面的優(yōu)勢,已經成為液冷數(shù)據中心主流。IDC數(shù)據顯示,2023上半年中國液冷服務器市場中,冷板式占比高達90%。但現(xiàn)有的冷板式液冷技術依然有持續(xù)優(yōu)化的空間,最主要的問題在于冷板一般僅覆蓋CPU、GPU等高功耗發(fā)熱部件,數(shù)據中心需要配置CDU和空調兩套冷卻系統(tǒng),PUE值無法達到接近于1的理想狀態(tài)。同時,傳統(tǒng)冷板式服務器是高度定制化產品,冷板的材質選擇、結構設計、加工工藝以及部件規(guī)格等不一致,規(guī)?;瘧檬芟?。因此,冷板式液冷需要從系統(tǒng)級解決方案出發(fā),以模塊化解耦設計思維,創(chuàng)新出一種高能效、易運維、使用更安全,兼容性更出色、液冷覆蓋率更高的全液冷冷板結構設計。
作為目前液冷產業(yè)技術創(chuàng)新的前沿領域,全液冷冷板技術可實現(xiàn)"服務器內去風扇、數(shù)據中心去空調化"運行,更加高效節(jié)能與靜音,并以高集成度節(jié)省30%左右的數(shù)據中心空間,單機柜支持100KW的高密度部署。
浪潮信息基于自身在液冷技術創(chuàng)新、產業(yè)化推進及國標團標等產業(yè)標準化方面的長期實踐,與英特爾、OCTC開放計算標準工作委員會、全國信息技術標準化技術委員會算力標準工作組、中國電子技術標準化研究院聯(lián)合編寫了《全液冷冷板系統(tǒng)參考設計及驗證白皮書》,旨在為全液冷冷板服務器設計和規(guī)模應用中面臨的主要難點提供創(chuàng)新設計參考,以模塊化解耦的先進設計理念,推動基于通用服務器架構的全液冷冷板技術快速普及。
白皮書指出,冷板液冷服務器設計技術優(yōu)化方向主要圍繞通過技術創(chuàng)新進一步提高能效,降低初期投資成本,減少漏液安全隱患及提高運維便利性展開,一是持續(xù)完善部件液冷方案,提高液冷覆蓋率;二是提高通用化及可維護性;三是拓展冷板液冷材料范圍,減輕重量,降低成本;四是提升液冷系統(tǒng)長期使用的安全性,降低漏液風險。
創(chuàng)新實踐——全液冷冷板服務器,打通規(guī)?;瘧玫?quot;最后一公里"
白皮書詳細介紹了浪潮信息在全液冷冷板技術上的創(chuàng)新實踐成果——全液冷冷板服務器,實現(xiàn)了對CPU、高功耗內存、NVMe硬盤、OCP網卡、電源、PCIe轉接卡和光模塊等服務器主要發(fā)熱部件的冷板全液冷覆蓋,并針對不同部件的結構、材質、工作溫度等差異化需求,創(chuàng)新設計了諸多系統(tǒng)部件級液冷解決方案,實現(xiàn)了液冷模塊解耦,為全球液冷產業(yè)鏈上下游提供極具價值的參考樣板,推動先進全液冷冷板解決方案在全球數(shù)據中心的大規(guī)模部署應用,實現(xiàn)數(shù)據中心更加綠色低碳可持續(xù)發(fā)展。
全液冷冷板服務器的CPU冷板模組基于英特爾第五代至強平臺可擴展處理器冷板的設計要求,綜合考慮散熱,結構性能,成品率,價格及不同材質冷板設計兼容性等因素優(yōu)化而成的一款CPU冷板參考設計,主要由CPU冷板鋁支架,CPU冷板及冷板接頭等部件組成。
內存液冷設計采用創(chuàng)新型的枕木散熱器液冷方案,因內存插滿如鐵軌上的枕木而得名。它將傳統(tǒng)風冷散熱和冷板散熱相結合,通過內置熱管的散熱器(或純鋁/銅板、Vaper Chamber等)把內存上的熱量傳遞至兩端,與冷板通過選定的導熱墊片接觸,最終通過冷板內的冷卻液把熱量帶走實現(xiàn)內存散熱。相比現(xiàn)有的管路(Tubing)內存液冷方案,枕木散熱器液冷方案采用模塊化設計,具有易于組裝和維護、通用性好、性價比高等優(yōu)勢。
固態(tài)硬盤液冷方案同樣采用創(chuàng)新設計,通過內置熱管的散熱器把硬盤區(qū)域的熱量導出與硬盤區(qū)域外的冷板通過導熱墊片垂直接觸實現(xiàn)換熱。此固態(tài)硬盤液冷方案主要由裝有散熱器的固態(tài)硬盤模組,固態(tài)硬盤冷板,硬盤模組鎖緊機構,及硬盤支架組成。硬盤模組鎖緊機構固定在硬盤支架上提供合適的預緊力來保證固態(tài)硬盤模組和固態(tài)硬盤冷板的長期接觸可靠性。為了方便硬盤冷板環(huán)路在狹小空間內的安裝,硬盤支架在服務器深度方向采用了抽屜式的安裝方式設計。相比業(yè)界已有的硬盤液冷嘗試,此方案可支持 30 次以上系統(tǒng)不斷電熱插拔,可靠性高,對加工工藝要求低,漏液風險低,同時可靈活適配不同厚度和數(shù)量的固態(tài)硬盤系統(tǒng)。
此外,浪潮信息對PCIe卡、OCP網卡和電源等部件均進行了創(chuàng)新的冷板設計,在冷板材質方面也進行了探索實踐,分別基于銅材質和鋁合金材質冷板,從換熱性能、可靠性、成本、重量等多方面進行對比及優(yōu)化,同時對與鋁質冷板液冷循環(huán)回路相匹配的液冷工質,進行了選型和相應的腐蝕性測試驗證,為進一步降低冷板液冷成本提供了豐富的實踐數(shù)據支持。
在測試驗證部分,全液冷冷板服務器進行了散熱性能測試、液冷熱捕獲效率(HCR)測試、流阻測試等多項測試。在散熱性能測試中,銅冷板系統(tǒng)(冷卻工質PG25)在目標最差邊界條件下所有的零部件溫度都滿足溫度要求,并且還有一定安全溫度裕量;在液冷熱捕獲效率(HCR)測試中,在典型的液冷系統(tǒng)工作邊界條件下—系統(tǒng)進水溫度38?C(W32),空氣環(huán)境溫度35?C,全液冷冷板服務器液冷熱捕獲效率(HCR)在93%左右,整機柜測試HCR值更高,可接近98%;在流阻測試中,冷卻工質PG25在相同溫度和流量下比純水流阻高20%左右,同一工質溫度越高流阻越低,PG25的流阻相比純水對溫度更為敏感。在51?C進水溫度1.3LPM流量條件下,采用冷卻工質PG25和純水的系統(tǒng)流阻分別是118kPa和99.6kPa。
全面測試結果表明,浪潮信息全液冷冷板服務器可實現(xiàn)接近100%液冷散熱,系統(tǒng)無風扇運行,可達到PUE接近于1的極限水平,并通過"去空調化"節(jié)省 30%以上的數(shù)據中心空間,充分滿足數(shù)據中心的高密度部署需求。