omniture

亞馬遜云科技推出全新數(shù)據中心組件,支持AI創(chuàng)新并進一步提升能效

亞馬遜云科技
2024-12-11 10:40 2534

亞馬遜云科技最新發(fā)布了一套靈活的數(shù)據中心組件,以支持新一代生成式AI創(chuàng)新,不僅提供12%的額外算力,還提高了可用性和運行效率。

北京2024年12月11日 /美通社/ -- 亞馬遜云科技在2024 re:Invent全球大會上,宣布推出一系列數(shù)據中心新組件,旨在支持新一代人工智能(AI)創(chuàng)新并滿足客戶不斷變化的需求。亞馬遜云科技通過對電源、冷卻和硬件設計等進行的一系列創(chuàng)新,構建了一個更加節(jié)能的數(shù)據中心,為客戶進一步創(chuàng)新奠定基礎。亞馬遜云科技在全球新推出的數(shù)據中心都將具備這些新組件,現(xiàn)有的數(shù)據中心已經部署了很多關鍵組件。

亞馬遜云科技基礎設施服務副總裁Prasad Kalyanaraman表示:"亞馬遜云科技通過持續(xù)推動基礎設施創(chuàng)新,致力于為全球客戶構建性能卓越、可靠、安全且可持續(xù)發(fā)展的云。我們數(shù)據中心的這些新能力,包括能源效率的提升以及對新興工作負載的靈活支持,是我們在云計算領域的又一重要進展。更令人興奮的是,這些功能均采用模塊化設計,這讓我們得以對現(xiàn)有基礎設施進行升級改造,實現(xiàn)液體冷卻并提高能源效率,這不僅為生成式AI應用提供強大的動力,同時還降低了我們的碳足跡。"

亞馬遜云科技擁有18年構建大規(guī)模數(shù)據中心的深厚經驗,以及13年為AI工作負載提供基于GPU的服務器的豐富經驗。目前,亞馬遜云科技的數(shù)據中心為全球數(shù)百萬活躍客戶提供服務,包括數(shù)十萬使用亞馬遜云科技AI和機器學習服務的客戶,以及全球數(shù)萬個使用Amazon Bedrock構建其生成式AI應用的客戶。隨著生成式AI的日益普及以及客戶對GPU容量需求的不斷增長,亞馬遜云科技不斷調整和優(yōu)化數(shù)據中心,以支持更高的功率密度需求。主要的提升包括:

1.  簡化電氣和機械設計,提高可用性

亞馬遜云科技始終致力于打造業(yè)界最可靠的基礎設施。簡化的電氣和機械設計更可靠,并易于維護,能確??蛻羰芤嬗诟呖捎眯裕@是亞馬遜云科技自創(chuàng)立之日起始終為客戶提供的。

亞馬遜云科技最新的數(shù)據中心設計優(yōu)化中,就包括簡化的電力分配和機械系統(tǒng),實現(xiàn)基礎設施的可用性達99.9999%。同時,簡化的系統(tǒng)將可能受到電氣問題影響的機架數(shù)量減少89%。

在亞馬遜云科技的數(shù)據中心內,電力供應需經過一系列轉換與分配過程,才能抵達IT設備。這一流程中的每一步驟都伴隨著效率的損耗、能源的消耗,以及潛在的故障風險。例如,亞馬遜云科技簡化了電力分配系統(tǒng),從而將潛在故障點的數(shù)量減少了20%。簡化的另一個例子還包括將備用電源更緊密地集成至機架附近,并減少排熱風扇的數(shù)量。亞馬遜云科技使用自然壓差來排出熱空氣,這提高了服務器的可用電力。這些改進措施不僅顯著降低了整體能耗,還最大限度地減少了故障風險。

2.  在冷卻、機架設計和控制系統(tǒng)進行創(chuàng)新

亞馬遜云科技推出了一系列新功能及增強功能,致力于為客戶提供具有高性能、高可用性和能效卓越的基礎設施。亞馬遜云科技數(shù)據中心的創(chuàng)新包括:

  • 液體冷卻:新型的AI服務器將受益于液體冷卻更有效地應對高密度計算芯片的冷卻需求。亞馬遜云科技開發(fā)了一項先進的機械冷卻解決方案——在其新建及現(xiàn)有數(shù)據中心配置"液體到芯片"的冷卻系統(tǒng)。一些亞馬遜云科技的技術利用不需要液體冷卻的網絡和存儲基礎設施,因此更新后的冷卻系統(tǒng)將無縫集成空氣和液體冷卻功能,用于支持包括如Amazon Trainium2的強大AI芯片系列,NVIDIA GB200 NVL72等機架級AI超級計算解決方案,以及亞馬遜云科技網絡交換機和存儲服務器。無論客戶運行傳統(tǒng)工作負載還是AI模型,這種靈活的多模式冷卻設計確保了亞馬遜云科技都能以最低的成本為客戶提供最佳性能和效率。這種獨特的液體冷卻機架設計是亞馬遜云科技與領先的芯片制造商合作開發(fā)的,旨在加快AI工作負載的上市時間。
  • 支持高密度AI工作負載:亞馬遜云科技通過優(yōu)化數(shù)據中心的機架布局,最大化電力使用效率。亞馬遜云科技通過軟件實現(xiàn)了這一點,該軟件由數(shù)據和生成式AI驅動,能夠精確預測服務器的最佳部署方式。亞馬遜云科技將減少浪費的電力,包括閑置以及未充分使用的能源,從而更有效地利用可用的能源。

這一設計旨在滿足AI工作負載對新一代硬件和高密度機架配置的需求,同時又保持足夠的靈活性,適配其他廣泛的硬件需求。亞馬遜云科技基礎設施為客戶提供了廣泛而深入的計算實例選擇,現(xiàn)已提供超過750種Amazon Elastic Cloud Compute (Amazon EC2)實例,讓客戶可為幾乎所有的工作負載選擇最合適的處理器、存儲、網絡、操作系統(tǒng)以及購買選項。除了靈活的多模式冷卻解決方案外,亞馬遜云科技在電力傳輸系統(tǒng)上也實現(xiàn)了工程突破,使得亞馬遜云科技在未來兩年內能夠將機架功率密度提升6倍,并有望在未來進一步提升3倍。這部分得益于新的電源架的應用,新的電源架能夠高效地在整個機架內分配電力,顯著降低了電力轉換過程中的損耗。 

總體而言,這些創(chuàng)新措施讓亞馬遜云科技每個站點為客戶工作負載提供增加12%的計算能力。這一進步意味著在提供同等計算能力的情況下,所需的數(shù)據中心數(shù)量將會減少。

  • 升級的控制系統(tǒng):新推出的由亞馬遜自主研發(fā)的控制系統(tǒng)已應用于亞馬遜云科技的電氣與機械設備中,實現(xiàn)了監(jiān)控、報警和運營流程的標準化。例如,利用亞馬遜云科技內部構建的遙測工具使用亞馬遜云科技的技術,能夠提供實時診斷和故障排除服務,這些服務確保客戶保持最佳運行狀態(tài)。此外,亞馬遜云科技在提升控制系統(tǒng)冗余度的同時,也簡化了系統(tǒng)復雜性。這些改進使得亞馬遜云科技基礎設施可用性設計達到99.9999%。

3.  實現(xiàn)能效與可持續(xù)的雙提升:機械能耗降低46%,混凝土含碳量減少35%

多年來,亞馬遜云科技在推動基礎設施能效與可持續(xù)性方面始終走在行業(yè)前列。據研究顯示,亞馬遜云科技的基礎設施效率是企業(yè)自建基礎設施的4.1倍,通過在亞馬遜云科技上優(yōu)化工作負載,相關的碳足跡能夠最高減少99%。在2023年,亞馬遜云科技已提前實現(xiàn)了運營所需電力100%來自可再生能源的目標,比原定的2030年提前了七年。

亞馬遜云科技不斷評估其數(shù)據中心的運行,通過不懈的創(chuàng)新提高基礎設施的能源利用率。新組件在能效和可持續(xù)發(fā)展上的更新如下:

  • 更高效的冷卻系統(tǒng),在高峰冷卻需求期間,與前一代設計相比預計其機械能耗降低高達46%,同時每兆瓦的用水量不變。設計改變包括全新的單側冷卻系統(tǒng)、減少冷卻設備數(shù)量以及引入液體冷卻功能。
  • 降低數(shù)據中心建筑外殼混凝土的固有碳排放量,較行業(yè)平均水平最高可降低35%。亞馬遜云科技采用了規(guī)范的低碳鋼和低碳混凝土,并通過優(yōu)化結構設計來減少鋼材的使用總量。
  • 備用發(fā)電機將采用可再生柴油,這是一種可生物降解且無毒的燃料,與傳統(tǒng)的化石柴油相比,其生命周期內的溫室氣體排放量可減少高達90%。亞馬遜云科技已開始在歐洲和美國的數(shù)據中心推廣使用可再生柴油作為備用發(fā)電機的燃料。

英偉達超大規(guī)模與高性能計算事業(yè)部副總裁Ian Buck表示:"隨著AI需求的不斷發(fā)展,數(shù)據中心亦需同步加速演進。先進的液體冷卻解決方案能夠高效的冷卻AI基礎設施,同時顯著降低能耗。我們與亞馬遜云科技在液體冷卻機架設計上的攜手合作,將幫助客戶以卓越的性能和效率運行高強度的AI工作負載。"

"在Anthropic,我們致力于開發(fā)領先的基礎模型,而安全、高性能且節(jié)能的基礎設施是我們成功的關鍵,"Anthropic計算部門杰出工程師James Bradbury表示:"亞馬遜云科技致力于構建先進的數(shù)據中心,這是我們選擇其作為主要云服務提供商和模型訓練合作伙伴的重要原因之一。亞馬遜云科技的設計改進顯著提升了基礎設施的安全性、可擴展性和效率,為AI模型的運行和創(chuàng)新提供了強有力的支撐。"

亞馬遜云科技的數(shù)據中心新組件將在亞馬遜云科技全球基礎設施進行部署,覆蓋全球34個區(qū)域、108個可用區(qū),以及如Amazon Local Zones等其他基礎設施。預計在2025年初,包含完整組件的新型亞馬遜云科技數(shù)據中心建設將在美國啟動。

欲了解更多關于亞馬遜云科技基礎設施的信息,請訪問https://aws.amazon.com/about-aws/global-infrastructure/

關于亞馬遜云科技

自2006年以來,亞馬遜云科技(Amazon Web Services)一直以技術創(chuàng)新、服務豐富、應用廣泛而享譽業(yè)界。亞馬遜云科技一直不斷擴展其服務組合以支持幾乎云上任意工作負載,目前提供超過240項全功能的服務,涵蓋計算、存儲、數(shù)據庫、網絡、數(shù)據分析、機器學習與人工智能、物聯(lián)網、移動、安全、混合云、媒體,以及應用開發(fā)、部署與管理等方面;基礎設施遍及34個地理區(qū)域的108個可用區(qū),并已公布計劃在墨西哥、新西蘭、沙特阿拉伯和泰國等新建6個區(qū)域、18個可用區(qū)。全球數(shù)百萬客戶,包括發(fā)展迅速的初創(chuàng)公司、大型企業(yè)和領先的政府機構,都信賴亞馬遜云科技,通過亞馬遜云科技的服務支撐其基礎設施,提高敏捷性,降低成本。要了解更多關于亞馬遜云科技的信息,請訪問:www.amazonaws.cn

免責聲明:

本新聞稿中提及的生成式AI新發(fā)布服務暫時僅在亞馬遜云科技境外區(qū)域可用,亞馬遜云科技中國僅為幫助您了解行業(yè)前沿技術和發(fā)展海外業(yè)務選擇推介該服務。

消息來源:亞馬遜云科技
China-PRNewsire-300-300.png
能動
微信公眾號“能動”發(fā)布全球能源、化工、采礦、動力、新能源車企業(yè)最新的經營動態(tài)。掃描二維碼,立即訂閱!
collection