亞馬遜云科技推出三款由自研芯片支持的新Amazon EC2實例

亞馬遜云科技

2021-12-01 15:36 5154

Amazon EC2 C7g實例由新的Amazon Graviton3處理器支持，與Amazon Graviton2處理器支持的當(dāng)前一代C6g實例相比，計算密集型工作負(fù)載性能提高多達25%
Amazon EC2 Trn1實例由Amazon Trainium芯片支持，在Amazon EC2中為絕大多數(shù)機器學(xué)習(xí)模型訓(xùn)練提供最佳性價比及最快的訓(xùn)練速度
Amazon EC2 Im4gn/Is4gen/I4i實例配備新的Amazon Nitro SSDs，可為I/O密集型工作負(fù)載提供最佳存儲性能

北京2021年12月1日 /美通社/ -- 在亞馬遜云科技re:Invent全球大會上，亞馬遜云科技宣布推出三款由自研芯片支持的新Amazon Elastic Compute Cloud (Amazon EC2)實例，幫助客戶顯著提升在Amazon EC2上運行的工作負(fù)載的性能、成本和能源效率。新C7g 實例由Amazon Graviton3 處理器支持，與由 Amazon Graviton2 處理器支持的當(dāng)前一代 C6g 實例相比，性能提高25%。由Amazon Trainium芯片支持的新Trn1實例為在Amazon EC2中訓(xùn)練絕大多數(shù)機器學(xué)習(xí)模型提供最佳性價比，及最快的訓(xùn)練速度。基于自研Amazon Nitro SSDs（固態(tài)驅(qū)動器）的新存儲優(yōu)化型Im4gn/Is4gen/ I4i實例為在Amazon EC2上運行的I/O密集型工作負(fù)載提供最佳存儲性能。這些基于亞馬遜云科技自研芯片的新Amazon EC2實例的發(fā)布，將幫助客戶支持其關(guān)鍵業(yè)務(wù)應(yīng)用程序。

亞馬遜云科技Amazon EC2副總裁David Brown表示：“我們對自研芯片的持續(xù)投入升級，已經(jīng)讓客戶在當(dāng)今一些關(guān)鍵工作負(fù)載中獲得了巨大的性價比優(yōu)勢。客戶希望我們在每一代新的EC2實例上不斷突破邊界。亞馬遜云科技的持續(xù)創(chuàng)新讓客戶有機會使用這些全新的、改變游戲規(guī)則的實例運行其重要的工作負(fù)載，獲得更好的性價比?！?/p>

C7g實例由新的Amazon Graviton3處理器支持，與由Amazon Graviton2處理器支持的當(dāng)前一代C6g實例相比，性能提高多達25%

基于Amazon Graviton2的計算實例自2020年推出以來，被眾多客戶如DirecTV、Discovery、Epic Games、Formula 1、Honeycomb.io、Intuit、Lyft、MercardoLibre、NextRoll、Nielsen、SmugMug、Snap、Splunk和Sprinklr等在生產(chǎn)中使用并已經(jīng)獲得顯著的性能提升和成本節(jié)省。基于Graviton2的系列實例共有12種，包括通用型、計算優(yōu)化型、內(nèi)存優(yōu)化型、存儲優(yōu)化型、突發(fā)性能型和加速計算型實例，讓客戶擁有云上至深至廣的計算選擇，并兼顧性價比和能效。隨著客戶在云中開展更多計算密集型工作負(fù)載如高性能計算（HPC）、游戲和機器學(xué)習(xí)推理，相應(yīng)的計算、存儲、內(nèi)存和網(wǎng)絡(luò)需求也隨之增長，客戶需要尋求更佳的性價比和能效來運行這些工作負(fù)載。

由Amazon Graviton3處理器支持的C7g實例與由 Graviton2 處理器支持的當(dāng)前一代 C6g 實例相比，可將計算密集型工作負(fù)載性能提高多達25%。Amazon Graviton3處理器與Graviton2相比，為科學(xué)計算、機器學(xué)習(xí)和媒體編碼工作負(fù)載提供高達2倍的浮點運算性能，為加密工作負(fù)載速度提升高達2倍，為機器學(xué)習(xí)工作負(fù)載提供高達3倍的性能。Amazon Graviton3處理器的能效也更高，在相同性能下，與同類型EC2實例對比，可節(jié)省高達60%的能源消耗。C7g實例是云中第一個采用最新DDR5內(nèi)存的實例，與基于Amazon Graviton2的實例相比，它提高了50%的內(nèi)存帶寬，從而提高了科學(xué)計算等內(nèi)存密集型應(yīng)用的性能。與基于Amazon Graviton2的實例相比，C7g實例的網(wǎng)絡(luò)帶寬也高出20%。C7g 實例支持 Elastic Fabric Adapter (EFA)，允許應(yīng)用程序直接與網(wǎng)絡(luò)接口卡通信，提供更低且更一致的延遲，提高需要大規(guī)模并行處理（如 HPC 和視頻編碼）的應(yīng)用程序的性能。C7g實例現(xiàn)已提供預(yù)覽版。欲了解更多C7g實例的信息，請訪問aws.amazon.com/ec2/instance-types/c7g。

由Amazon Trainium芯片支持的Trn1實例為在Amazon EC2中訓(xùn)練絕大多數(shù)機器學(xué)習(xí)模型提供最佳性價比，及最快的訓(xùn)練速度

越來越多客戶正在構(gòu)建、訓(xùn)練和部署機器學(xué)習(xí)模型，支持能夠重塑其業(yè)務(wù)和客戶體驗的應(yīng)用程序。為了確保提高準(zhǔn)確性，這些機器學(xué)習(xí)模型必須構(gòu)建在越來越多的訓(xùn)練數(shù)據(jù)上，導(dǎo)致其訓(xùn)練成本越來越高。這可能會限制客戶能夠部署的機器學(xué)習(xí)模型數(shù)量。亞馬遜云科技為機器學(xué)習(xí)提供至深至廣的計算服務(wù)選擇，包括采用NVIDIA A100 Tensor Core GPU的EC2 P4d實例和采用Habana Labs Gaudi 加速器的 EC2 DL1 實例。但是，即使擁有當(dāng)今最快的加速實例，訓(xùn)練持續(xù)變大的機器學(xué)習(xí)模型仍然是非常昂貴和耗時的。

由Amazon Trainium芯片支持的Trn1實例為在Amazon EC2中進行深度學(xué)習(xí)模型訓(xùn)練提供最佳性價比以及最快的訓(xùn)練速度，與P4d實例相比，通過Trn1實例訓(xùn)練深度學(xué)習(xí)模型的成本降低多達40%。Trn1實例提供800Gbps EFA網(wǎng)絡(luò)帶寬（比最新基于GPU的EC2實例高兩倍），并與Amazon FSx for Lustre高性能存儲集成，讓客戶可以啟動具有EC2 UltraClusters功能的Trn1實例。通過EC2 UltraClusters，開發(fā)人員可以將機器學(xué)習(xí)訓(xùn)練擴展到一萬多個與 PB 級網(wǎng)絡(luò)互連的 Trainium 加速器，讓客戶按需訪問超算級性能，即便是最大型和最復(fù)雜的模型，訓(xùn)練時間也可以從幾個月縮短到幾天。Trn1實例現(xiàn)已提供預(yù)覽版。欲了解更多Trn1實例的信息，請訪問aws.amazon.com/ec2/instance-types/trn1。

采用全新Amazon Nitro SSDs的Im4gn/Is4gen/ I4i實例可為I/O密集型工作負(fù)載提供最佳存儲性能

如今，客戶將I3/I3en存儲優(yōu)化型實例用于需要直接訪問本地存儲數(shù)據(jù)集的應(yīng)用程序，比如橫向擴展的事務(wù)型和關(guān)系型數(shù)據(jù)庫（如MySOL和PostgreSQL），NoSQL數(shù)據(jù)庫（如Cassandra、MongoDB、Redis等），大數(shù)據(jù)（如Hadoop）和數(shù)據(jù)分析工作負(fù)載（如Spark、Hive、Presto等）。I3/I3en實例以低成本提供非易失性內(nèi)存標(biāo)準(zhǔn)(NVMe) SSD支持的實例存儲，針對低延遲、高 I/O 性能和吞吐量進行了優(yōu)化?？蛻粝矚gI3/I3en實例提供的快速事務(wù)處理能力，但隨著其工作負(fù)載的不斷升級——在更大規(guī)模的數(shù)據(jù)集上處理更復(fù)雜的事務(wù)，他們需要在不增加成本的情況下獲得更高的計算性能和更快的數(shù)據(jù)訪問速度。

Im4gn/Is4gen/I4i實例旨在通過架構(gòu)最大限度提高I/O密集型工作負(fù)載的存儲性能。通過自研的 Amazon Nitro SSDs ，Im4gn/Is4gen/I4i實例提供高達 30 TB 的 NVMe 存儲，與上一代I3實例相比，I/O 延遲降低了 60%，延遲可變性降低了 75%，從而最大限度地提高了應(yīng)用程序性能。Amazon Nitro SSDs通過優(yōu)化存儲堆棧、虛擬化管理程序和硬件與Amazon Nitro 系統(tǒng)緊密集成。與使用商用SSD相比，亞馬遜云科技同時管理Amazon Nitro SSDs的硬件和固件，使SSD更新交付速度更快，讓客戶可以從改進的功能中獲益。Im4gn 實例（現(xiàn)已可用）采用 Amazon Graviton2 處理器，與 I3 實例相比，性價比提高多達 40%，每 TB存儲成本降低多達 44%。Is4gen 實例（現(xiàn)已可用）也采用 Amazon Graviton2 處理器，與 I3en 實例相比，每 TB 存儲成本降低多達 15%，計算性能提高多達 48%。開始使用Im4gn/Is4gn實例，請訪問aws.amazon.com/ec2/instance-types/i4g。I4i實例（即將可用）采用英特爾第三代可擴展處理器（Ice Lake），與當(dāng)前一代 I3 實例相比，計算性能提高多達 55%。欲了解更多Im4gn/Is4gen/ I4i實例的信息，請訪問aws.amazon.com/ec2/instance-types/i4i。

SAP HANA是世界領(lǐng)先的內(nèi)存數(shù)據(jù)庫，是SAP業(yè)務(wù)技術(shù)平臺的基礎(chǔ)。SAP HANA數(shù)據(jù)庫與分析總裁Irfan Khan表示：“過去十年中，SAP HANA幫助客戶管理他們最關(guān)鍵的事務(wù)和分析工作負(fù)載。亞馬遜云科技在基于ARM的Amazon Graviton處理器的持續(xù)投入與創(chuàng)新，與亞馬遜云科技的合作帶來諸多可能，為我們的企業(yè)客戶和SAP HANA云支持的SAP云分析和數(shù)據(jù)管理解決方案帶來了顯著的運營效率和性能提升?！?/p>

Twitter承載著當(dāng)前正在發(fā)生和人們正在討論的事情。Twitter平臺主管Nick Tornow表示：“Twitter正在進行一個為期多年的項目，利用基于Amazon Graviton處理器的Amazon EC2實例來提供Twitter時間線。為進一步提高效率，我們測試了新的基于Amazon Graviton3處理器的C7g實例。在一系列可以代表Twitter工作負(fù)載性能的基準(zhǔn)測試中，我們發(fā)現(xiàn)基于Amazon Graviton3處理器的C7g實例與基于Amazon Graviton2處理器的C6g實例相比，可將性能提高20%-80%，同時還將尾部延遲減少多達35%。我們非常高興并期待利用基于Amazon Graviton3處理器的實例獲得更好的性價比。”

一級方程式（F1）賽車始于1950年，是世界上最負(fù)盛名的賽車比賽，也是全球最受歡迎的年度體育賽事?！盎贏mazon Graviton2處理器的C6g實例已經(jīng)為我們的一些CFD（計算流體仿真力學(xué)）工作負(fù)載提供了最佳性價比?，F(xiàn)在，我們發(fā)現(xiàn)在同樣的模擬中，基于Graviton3的 C7g實例比基于Graviton2的 C6g實例快40%?！币患壏匠淌焦芾硎紫夹g(shù)官Pat Symonds表示：“我們很高興EFA將在這種實例類型中標(biāo)配?；贕raviton3的實例在性價比方面的優(yōu)越表現(xiàn)，我們期待它成為運行所有CFD工作負(fù)載的最佳選擇?！?/p>

Epic Games創(chuàng)立于1991年，是Fortnite、Unreal、Gears of War、Shadow Complex和Infinity Blade系列游戲的創(chuàng)造者。Epic的Unreal Engine技術(shù)為PC、主機、手機、AR、VR和Web帶來了高保真、交互式的體驗。Epic Games高級工程總監(jiān)Mark Imbriaco表示：“當(dāng)我們展望未來，為玩家構(gòu)建更加引人入勝的沉浸式體驗時，我們很高興使用基于Amazon Gravtion3處理器的EC2實例。我們的測試表明，它們甚至適用于要求最嚴(yán)苛、延遲敏感度最高的工作負(fù)載，同時提供卓越的性價比，提升了《堡壘之夜》和任何基于虛擬引擎創(chuàng)造的游戲體驗?！?/p>

Honeycomb開發(fā)了一個可視化平臺，讓工程團隊可以可視化、分析和改善云應(yīng)用程序的質(zhì)量和性能?！拔覀兒芨吲d能夠基于Amazon Graviton3的預(yù)覽實例測試我們的高吞吐遙感攝取工作負(fù)載?！?nbsp;honeycomb.io首席開發(fā)者布道師Liz Fong-Jones表示：“在處理相同工作負(fù)載的情況下，我們運行的C7g實例比C6g少30%，延遲降低了30%。我們期待在Amazon Graviton3的C7g實例正式可用后盡快投入到我們的生產(chǎn)環(huán)境中?！?/p>

Meta AI專注于將人們與其關(guān)心的事物聯(lián)系起來，提供有意義且安全的體驗，推進機器學(xué)習(xí)并指導(dǎo)開放研究。Meta AI PyTorch工程高級總監(jiān)Lin Qiao表示：“PyTorch開發(fā)人員不斷創(chuàng)新，以提高深度學(xué)習(xí)模型的準(zhǔn)確性，并找到更好的方法解決問題。同時，這些模型的規(guī)模呈指數(shù)級增長，這讓訓(xùn)練它們變得更加困難，成本更高。我們的PyTorch團隊一直在與Amazon Neuron團隊合作，為易用性和性能設(shè)定了一個高標(biāo)準(zhǔn)，確保在PyTorch中為Trainium等加速器提供原生支持。這其中包括研究集體計算原語，以及為擴展性能和分布式訓(xùn)練設(shè)置適當(dāng)?shù)幕A(chǔ)。我們期待與亞馬遜云科技合作，將Trainium與PyTorch原生產(chǎn)品（如eager mode和dynamic shapes）進行更多集成?！?/p>

Anthropic構(gòu)建了可靠、可解釋和可操控的人工智能系統(tǒng)，這些系統(tǒng)將有機會為商業(yè)和公共利益創(chuàng)造價值。Anthropic聯(lián)合創(chuàng)始人Tom Brown表示：“我們的研究興趣橫跨多個領(lǐng)域，包括自然語言、人工反饋、縮放定律、強化學(xué)習(xí)、代碼生成和可解釋性。我們成功的一個關(guān)鍵是利用現(xiàn)代基礎(chǔ)設(shè)施，讓我們可以啟動超大高性能深度學(xué)習(xí)加速器的集群。我們期待使用Amazon Trainium芯片支持的Trn1實例，因為它們具有前所未有的能力，可以擴展到上萬個節(jié)點，還有更高的網(wǎng)絡(luò)帶寬，這將讓我們可以在控制成本的同時更快地迭代?！?/p>

Splunk是領(lǐng)先的數(shù)據(jù)平臺提供商，旨在調(diào)查、監(jiān)控、分析和處理任何規(guī)模的數(shù)據(jù)。Splunk云平臺和基礎(chǔ)設(shè)施副總裁Brad Murphy表示：“我們運行基于C/C++的工作負(fù)載來索引和搜索事件數(shù)據(jù)。我們的工作負(fù)載受CPU限制，并受益于高容量和低延遲的SSD存儲。在評估由Amazon Graviton2支持的新Im4gn/Is4gen實例時，我們觀察到，與當(dāng)前使用的I3/I3en實例相比，搜索運行時間減少了50%。Im4gn和Is4gen實例成為運行我們存儲密集型工作負(fù)載的絕佳選擇，性價比顯著提升且TCO更低?！?/p>

Sprinklr通過 30 多個數(shù)字化渠道幫助全球大型企業(yè)提升客戶滿意度——使用為企業(yè)構(gòu)建的先進、復(fù)雜的人工智能引擎來創(chuàng)建洞察力驅(qū)動的策略，創(chuàng)造更優(yōu)秀的客戶體驗?！拔覀冊谟葾mazon Graviton2處理器支持的Amazon EC2 Im4gn/Is4gen實例上對基于Java的搜索工作負(fù)載進行了基準(zhǔn)測試。與較大的I3en實例相比，較小的 Is4gen 實例就能提供相似的性能，這意味著有機會顯著降低TCO?！?nbsp;Sprinklr工程副總裁Abhay Bansal表示：“我們在將工作負(fù)載從I3實例遷移到Im4gn實例時，還發(fā)現(xiàn)查詢延遲顯著降低，多達50%，性價比提升40%。遷移到基于Amazon Graviton2的實例很容易，完成基準(zhǔn)測試需要兩周時間。我們對已有的經(jīng)驗感到非常滿意，并期待基于Im4gn和Is4gen實例在生產(chǎn)環(huán)境中運行這些工作負(fù)載?！?/p>

Redis Enterprise通過幫助軟件團隊為實時世界創(chuàng)建高性能數(shù)據(jù)層，為全球超過8000個組織提供關(guān)鍵任務(wù)應(yīng)用程序和服務(wù)。Redis聯(lián)合創(chuàng)始人兼首席技術(shù)官Yiftach Shoolman表示：“我們非常高興看到，全新低延遲Amazon Nitro SSDs的Amazon EC2 I4i實例提供比上一代實例更快的交易速度。我們預(yù)計I4i實例更強的存儲性能和更快的網(wǎng)絡(luò)和處理器速度將為我們那些基于I4i實例使用Redis-on-Flash的客戶帶來顯著改善，獲得更具吸引力的TCO?！?/p>

消息來源：亞馬遜云科技