亞馬遜云科技與英偉達擴展合作持續(xù)推進生成式AI創(chuàng)新

亞馬遜云科技

2024-03-20 12:54 3236

亞馬遜云科技將提供基于NVIDIA Grace Blackwell GPU的Amazon EC2實例和NVIDIA DGX Cloud，以加速構建及運行數(shù)萬億參數(shù)的規(guī)模大型語言模型的性能
Amazon Nitro系統(tǒng)、Elastic Fabric Adapter加密，以及與Blackwell加密集成的Amazon KMS密鑰管理服務，為客戶提供從訓練數(shù)據(jù)到模型權重的端到端控制，為客戶在亞馬遜云科技上的AI應用提供更強的安全保障
“Ceiba項目”——一臺完全依托亞馬遜云科技搭建、采用DGX Cloud的AI超級計算機，搭載了20,736顆GB200 Superchips芯片，能夠提供414 exaflops的處理能力，專為NVIDIA自身的AI研發(fā)工作設計
Amazon SageMaker與NVIDIA NIM推理微服務集成，以幫助客戶進一步優(yōu)化在GPU上運行基礎模型的性價比
亞馬遜云科技與英偉達之間的合作加速了在醫(yī)療保健和生命科學領域的AI創(chuàng)新

北京2024年3月20日 /美通社/ -- 亞馬遜云科技和英偉達宣布，英偉達在2024年GTC大會上推出的新一代NVIDIA Blackwell GPU平臺即將登陸亞馬遜云科技。亞馬遜云科技將提供NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU，這一舉措延續(xù)了雙方長期的戰(zhàn)略合作伙伴關系，旨在為客戶提供安全、先進的基礎設施、軟件及服務，助力客戶開啟新一代生成式AI的能力。

英偉達與亞馬遜云科技繼續(xù)匯聚各自的領先技術，包括具備英偉達最新多節(jié)點系統(tǒng)的下一代NVIDIA Blackwell平臺和AI軟件，以及亞馬遜云科技的Nitro系統(tǒng)、具備領先安全性的Amazon KMS密鑰管理服務、千萬億比特級的Elastic Fabric Adapter（EFA）網(wǎng)絡和Amazon EC2 UltraCluster超大規(guī)模集群等技術。基于上述技術打造的基礎設施和工具，使客戶能夠在Amazon EC2上以更快速度、更大規(guī)模、更低成本地對其構建和運行數(shù)萬億參數(shù)的大型語言模型（LLMs）進行實時推理，性能相較于配備前一代英偉達GPU的EC2實例有顯著改進。

亞馬遜云科技首席執(zhí)行官Adam Selipsky表示：“我們雙方的深入合作可以追溯到13年前，當時我們共同推出了世界上第一個亞馬遜云科技上的GPU云實例，而今天我們?yōu)榭蛻籼峁┝俗顝V泛的英偉達GPU解決方案。英偉達的下一代Grace Blackwell處理器是生成式AI和GPU計算領域的標志性事件。當結合亞馬遜云科技強大的EFA網(wǎng)絡、Amazon EC2 UltraClusters的超大規(guī)模集群功能，以及我們獨有的Amazon Nitro高級虛擬化系統(tǒng)及其安全功能時，我們就能夠使客戶更快、更大規(guī)模且更安全地構建和運行具有數(shù)萬億參數(shù)的大型語言模型。”

英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“人工智能正在以前所未有的速度推動新應用、新商業(yè)模式和跨行業(yè)的創(chuàng)新。我們與亞馬遜云科技的合作正在加速新的生成式AI能力的發(fā)展，并為客戶提供前所未有的計算能力，以開創(chuàng)無限可能。”

亞馬遜云科技與英偉達的新合作將顯著加快超萬億參數(shù)前沿大型語言模型的訓練

亞馬遜云科技將提供配置GB200 NVL72的英偉達Blackwell平臺，它配備72顆Blackwell GPU和36顆Grace CPU，通過第五代NVIDIA NVLink?互連。當與亞馬遜云科技強大的EFA網(wǎng)絡、Amazon Nitro高級虛擬化系統(tǒng)和Amazon EC2 UltraClusters超大規(guī)模集群等技術結合時，客戶能夠輕松擴展至數(shù)千個GB200 Superchips。英偉達Blackwell在亞馬遜云科技上的應用，使得該平臺在應對資源密集型和數(shù)萬億參數(shù)語言模型等推理工作負載加速方面實現(xiàn)了巨大飛躍。

基于此前搭載英偉達H100的Amazon EC2 P5實例的成功（客戶短期使用這些實例可通過Amazon EC2 Capacity Blocks for ML功能），亞馬遜云科技計劃提供配備B100 GPUs新的Amazon EC2實例，并支持在Amazon EC2 UltraClusters中部署以加速超大規(guī)模生成式AI的訓練和推理。GB200也將在NVIDIA DGX? Cloud上可用，這是一個在亞馬遜云科技上雙方共同開發(fā)的AI平臺，為企業(yè)開發(fā)者提供了構建和部署先進生成式AI模型所需的專用基礎設施和軟件。在亞馬遜云科技上推出的基于Blackwell的DGX Cloud實例將加速前沿生成式AI和超過1萬億參數(shù)的大語言模型的開發(fā)。

提升AI安全性：亞馬遜云科技Nitro系統(tǒng)、Amazon KMS、EFA加密與Blackwell加密技術緊密集成

隨著AI技術應用越來越廣泛，企業(yè)需要確信，在整個訓練流程中，他們的數(shù)據(jù)都得到了安全的處理。保護模型權重的安全至關重要，模型權重是模型在訓練過程中學習到的參數(shù)，對于模型做出預測的能力至關重要。確保模型權重的安全對保護客戶的知識產(chǎn)權、防止模型被篡改以及維護模型的完整性都是非常重要的。

亞馬遜云科技的AI基礎設施和服務已經(jīng)實現(xiàn)了安全特性，使客戶能夠控制其數(shù)據(jù)，并確保數(shù)據(jù)不會與第三方模型提供者共享。Amazon Nitro系統(tǒng)和英偉達GB200的結合將能夠阻止未授權個體訪問模型權重，從而把AI安全性提升到新的高度。GB200支持對GPU之間NVLink連接進行物理加密，以及對Grace CPU到Blackwell GPU的數(shù)據(jù)傳輸進行加密，同時EFA也能夠?qū)Ψ掌髦g的分布式訓練和推理過程的數(shù)據(jù)進行加密。GB200還將受益于Amazon Nitro系統(tǒng)，該系統(tǒng)將主機CPU/GPU的I/O功能卸載至專門的硬件上，以提供更加一致的性能，其增強的安全性可以在客戶端和云端全程保護客戶的代碼和數(shù)據(jù)在處理過程中的安全。這一獨有的功能已經(jīng)獲得了領先的網(wǎng)絡安全公司 NCC Group 的獨立驗證。

通過在Amazon EC2上使用GB200，亞馬遜云科技將使客戶能夠使用Amazon Nitro Enclaves和Amazon KMS，在其EC2實例旁創(chuàng)建一個可信執(zhí)行環(huán)境。Amazon Nitro Enclaves允許客戶使用Amazon KMS控制下的密鑰來加密他們的訓練數(shù)據(jù)和權重。從GB200實例內(nèi)部可以加載安全區(qū)（enclave），并且可以直接與GB200 Superchip通信。這使得Amazon KMS能夠以加密安全的方式直接與安全區(qū)通信，并直接傳遞密鑰材料。然后，安全區(qū)可以將該材料傳遞給GB200，這樣做能夠保護客戶實例中的數(shù)據(jù)，防止亞馬遜云科技操作人員訪問密鑰或解密訓練數(shù)據(jù)或模型權重，從而賦予客戶對其數(shù)據(jù)的無與倫比的控制權。

“Ceiba項目”利用Blackwell在亞馬遜云科技上推動英偉達未來生成式AI創(chuàng)新

在2023年亞馬遜云科技re:Invent大會上宣布的“Ceiba項目”，是英偉達與亞馬遜云科技合作建造的世界上最快的AI超級計算機之一。這臺專為英偉達自身的研究和開發(fā)而設的超級計算機，獨家托管在亞馬遜云科技上。這臺首創(chuàng)的擁有20,736顆GB200 GPU的超級計算機，采用新型NVIDIA GB200 NVL72配置構建，其特有的第五代NVLink將連接10,368顆NVIDIA Grace CPU。系統(tǒng)通過亞馬遜云科技第四代EFA網(wǎng)絡進行擴展，為每個Superchip提供高達800 Gbps的低延遲、高帶寬網(wǎng)絡吞吐量——能夠處理高達414 exaflops的AI計算量，與之前計劃在Hopper架構上構建Ceiba相比，性能提升了6倍。英偉達的研發(fā)團隊將利用Ceiba推進大語言模型、圖形（圖像/視頻/3D生成）與仿真、數(shù)字生物學、機器人技術、自動駕駛汽車、NVIDIA Earth-2氣候預測等領域的AI技術，以幫助英偉達推動未來生成式AI的創(chuàng)新。

亞馬遜云科技與英偉達的合作推動生成式人工智能應用開發(fā)及醫(yī)療健康與生命科學領域的應用進展

亞馬遜云科技與英偉達聯(lián)手，通過Amazon SageMaker與NVIDIA NIM推理微服務的整合，提供了高性能、低成本的生成式AI推理解決方案，該服務作為NVIDIA AI企業(yè)版的一部分提供?？蛻艨梢岳眠@一組合在Amazon SageMaker中快速部署和運行已預編譯且對NVIDIA GPU進行優(yōu)化的基礎模型，縮短生成式AI應用的推出時間。

亞馬遜云科技與英偉達還在利用計算機輔助的藥物發(fā)現(xiàn)領域進行合作拓展，推出了新的NVIDIA BioNeMo?基礎模型，用于生成化學、蛋白質(zhì)結構預測，以及理解藥物分子與目標的相互作用。這些新模型將很快在Amazon HealthOmics上提供，這是一個專為幫助醫(yī)療保健和生命科學組織存儲、查詢和分析基因組、轉(zhuǎn)錄組及其他組學數(shù)據(jù)而設計的專用服務。

Amazon HealthOmics和英偉達醫(yī)療保健團隊還合作推出生成式AI微服務，以推進藥物發(fā)現(xiàn)、醫(yī)療技術和數(shù)字健康領域的發(fā)展，該服務提供一個新的GPU加速的云端服務目錄，涵蓋生物學、化學、成像和醫(yī)療保健數(shù)據(jù)，以便醫(yī)療企業(yè)能夠在亞馬遜云科技上利用生成式AI的最新成果。

消息來源：亞馬遜云科技