omniture

新一代G7系列浪潮云海超融合EC糾刪功能設(shè)計

2023-09-05 17:04 6814

北京2023年9月5日 /美通社/ -- 浪潮云海在2023年5月正式發(fā)布新一代InCloud Rail G7系列超融合一體機,其內(nèi)置的InCloud dSAN超融合存儲組件,基于新一代的硬件平臺設(shè)計,支持全棧RDMA協(xié)議,同時在EC糾刪功能上也帶來全新體驗,為新時代用戶提供更豐富的產(chǎn)品功能。

本文將詳細解讀InCloud dSAN在新一代InCloud Rail G7系列超融合一體機上如何設(shè)計EC糾刪功能。

什么是EC糾刪碼技術(shù)?

糾刪碼技術(shù)是一種數(shù)據(jù)保護方法,主要是通過利用糾刪碼算法將原始數(shù)據(jù)分割成多段,然后進行擴展和編碼校驗,并將分段數(shù)據(jù)和校驗一并在磁盤、存儲節(jié)點或其他位置存儲起來,以達到容錯目的。基本原理:總數(shù)據(jù)塊 = 原始數(shù)據(jù)塊 + 校驗塊,常用表示為,n= k + m基本思想是將k塊原始的數(shù)據(jù)元素通過一定的編碼計算,得到m塊校驗元素。對于這k+m塊元素,當(dāng)其中任意的m塊元素發(fā)生故障(包括數(shù)據(jù)和校驗出錯),均可以通過對應(yīng)的重構(gòu)算法恢復(fù)出原來的k塊數(shù)據(jù)。

EC糾刪碼在塊存儲設(shè)計的挑戰(zhàn)

EC糾刪碼數(shù)據(jù)切分和計算示意圖
EC糾刪碼數(shù)據(jù)切分和計算示意圖

上述場景以K = 4,M = 2為例,首先將應(yīng)用數(shù)據(jù)拆分成4個分片,然后計算出兩個校驗條帶分片,然后按照數(shù)據(jù)分布算法,將6個分片數(shù)據(jù)下發(fā)到6個節(jié)點上存儲。由于多副本策略是客戶常用的數(shù)據(jù)冗余策略,我們將EC糾刪碼和三副本的的讀寫流程及故障場景下的流程做了相關(guān)分析:由下表中可得出,在正常寫流程中,需要消耗7個IO完成正常的寫入流程,同時在有故障場景的讀寫,需要7個IO,有較大的讀寫懲罰。另外,在小塊IO讀寫流程中,如果數(shù)據(jù)塊小于EC切片數(shù)據(jù)大小,會存在空間浪費的情況。

數(shù)據(jù)冗余策略

讀寫場景

消耗讀寫IO次數(shù)

EC(4+2)

正常讀

1個

正常寫

4個讀IO,3個寫IO

落在故障盤的讀

5個讀IO

落在故障盤的寫

5個讀IO + 2個寫IO

三副本

正常讀

1個

正常寫

3個

落在故障盤的讀

2個

落在故障盤的寫

1個

在超融合的應(yīng)用場景中,用戶經(jīng)常使用塊存儲承接應(yīng)用數(shù)據(jù),適用于包括虛擬化、云平臺、數(shù)據(jù)庫等場景。此種場景下會產(chǎn)生非常多的小塊隨機讀寫負載,同時用戶對于時延要求較高,要求控制在5ms以內(nèi),且要求在故障場景下,對業(yè)務(wù)影響較小。這些要求正是EC糾刪碼的缺點。

浪潮云海超融合在新一代G7平臺的EC設(shè)計

由于EC的優(yōu)劣勢明顯,如何在超融合塊存儲上使用EC功能是時下剛需,浪潮云海超融合在新一代G7平臺做了獨特的方案設(shè)計:

EC糾刪碼設(shè)計方案
EC糾刪碼設(shè)計方案

方案亮點主要有:

  • 數(shù)據(jù)分層管理:將數(shù)據(jù)存儲劃分為緩存層和數(shù)據(jù)層,其中緩存層使用高性的NVMe和Sata SSD存儲,同時在緩存層使用多副本的設(shè)計,提供高性能數(shù)據(jù)存儲能力。數(shù)據(jù)層提供EC存儲,主要由HDD硬盤存儲,提供高容量存儲空間。
  • 智能緩存管理:設(shè)計冷熱分層的智能緩存管理,高效識別熱點數(shù)據(jù)和冷數(shù)據(jù),同時設(shè)計全局的緩存管理功能,確??蛻舻臒釘?shù)據(jù)保存在緩存空間中。
  • 數(shù)據(jù)空間高效存儲:在緩存層中由于副本存儲,將上層應(yīng)用的小塊IO聚合,當(dāng)數(shù)據(jù)變成冷數(shù)據(jù)下刷至EC存儲層時,由于下刷采用數(shù)據(jù)對齊,聚合成大塊的順序條帶讀寫,可以在EC數(shù)據(jù)層進行高效的數(shù)據(jù)存儲。
  • EC加速計算:設(shè)計支持多個EC加速引擎,支持不同平臺的EC加速計算,其中在Intel平臺使用ISA-L的EC加速庫,發(fā)揮Intel CPU的EC計算能力。

為了驗證方案效果:同時對比ISA-L加速計算和使用Jerasure純軟件不經(jīng)過CPU加速計算的性能測試。下圖所示測試數(shù)據(jù)采用了金融和醫(yī)療等行業(yè)常用的數(shù)據(jù)庫應(yīng)用,使用1G的測試數(shù)據(jù),在觸發(fā)數(shù)據(jù)下刷場景下,使用EC算法選擇Reed-Solomon和Cauchy算法測試EC糾刪場景。從實驗數(shù)據(jù)發(fā)現(xiàn):

不同K/M模型ISA-L和Jerasure的EC計算帶寬對比
不同K/M模型ISA-L和Jerasure的EC計算帶寬對比

  • ISA-L在不同的K/M模型下,EC計算帶寬表現(xiàn)較為穩(wěn)定,而軟件計算隨著計算量增加呈線性下降趨勢;
  • ISA-L在新一代G7平臺的吞吐率為9.8 GB/s,相較于軟件計算提升5.7倍。

總結(jié):EC糾刪碼相較于多副本策略雖然可以提升存儲的利用率,如4 + 2場景利用率為66%,3副本只有33%,8 + 2可以做到80%。但是其涉及到EC的糾刪計算、數(shù)據(jù)校驗、讀寫懲罰等問題相較于多副本仍存在較多優(yōu)化空間。InCloud dSAN分布式存儲軟件在新一代G7平臺,依托于新硬件(Intel新一代至強CPU)、ISA-L軟件加速庫,設(shè)計新型的EC功能,采用獨特的數(shù)據(jù)分層、智能緩存管理、軟件硬協(xié)同等方案,解決了當(dāng)前廣泛存在的數(shù)據(jù)冗余和存儲空間利用難題。

消息來源:浪潮云海
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection