北京2017年12月18日電 /美通社/ -- 2017年11月在對(duì)未來科學(xué)的探索中,面對(duì)“天眼”探空、神舟飛天、墨子“傳信”等眾多原創(chuàng)基礎(chǔ)科學(xué)對(duì)整個(gè)產(chǎn)業(yè)帶來的巨大影響,科學(xué)界面提出了中國(guó)科學(xué)的未來是星辰大海的觀點(diǎn)。同樣是基礎(chǔ)技術(shù)創(chuàng)新,在存儲(chǔ)領(lǐng)域,面對(duì)數(shù)據(jù)的“星辰大?!?,浪潮智能存儲(chǔ)的InRAID技術(shù)實(shí)現(xiàn)化繁為簡(jiǎn)的數(shù)據(jù)管理策略:以“2+1”的硬盤虛擬化三板斧,實(shí)現(xiàn)了存儲(chǔ)的邏輯化,一舉管理數(shù)以浩如煙海的億級(jí)KB級(jí)邏輯塊。
RAID,企業(yè)級(jí)存儲(chǔ)的基本功
“天眼”探空、神舟飛天、墨子“傳信”、高鐵奔馳、北斗組網(wǎng)、超算“發(fā)威”、大飛機(jī)首飛……中國(guó)科學(xué)創(chuàng)新迎來前所未有的黃金時(shí)期。正如2017年11月未來科學(xué)大獎(jiǎng)?lì)C獎(jiǎng)典禮上,科學(xué)界人士所表示的:中國(guó)科學(xué)的征途是“星辰大?!保诨A(chǔ)科學(xué)研究領(lǐng)域有大量創(chuàng)新等待被探索。事實(shí)上,基礎(chǔ)科學(xué)做創(chuàng)新,在各個(gè)領(lǐng)域幾乎都是難題;但一旦做出創(chuàng)新了,就會(huì)帶動(dòng)業(yè)界技術(shù)進(jìn)步。比如基因工程、量子計(jì)算、腦科學(xué)研究等等基礎(chǔ)科學(xué),已然成為科學(xué)界的“星辰大海”,這些基礎(chǔ)科學(xué)的每一個(gè)成就對(duì)推動(dòng)科學(xué)技術(shù)進(jìn)步產(chǎn)生了巨大影響。
這一情況在存儲(chǔ)領(lǐng)域同樣得到了驗(yàn)證,RAID功能作為基礎(chǔ)的存儲(chǔ)介質(zhì)虛擬化技術(shù),關(guān)系著企業(yè)級(jí)存儲(chǔ)的性能、可靠性和靈活性,一直是考驗(yàn)業(yè)界存儲(chǔ)廠商技術(shù)實(shí)力的關(guān)鍵。浪潮智能存儲(chǔ)G2平臺(tái)如何通過InRAID技術(shù)創(chuàng)新,獲得比傳統(tǒng)RAID較高10倍的性能、重構(gòu)效率和容量擴(kuò)展提升呢?這得從RAID的演進(jìn)說起。
RAID演進(jìn)
RAID技術(shù)在存儲(chǔ)領(lǐng)域可以說是毋庸置疑的基礎(chǔ)技術(shù),很多IT從業(yè)者就是從RAID技術(shù)開始了解企業(yè)級(jí)存儲(chǔ)的。RAID是什么呢?根據(jù)全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì)SNIA(the Storage Networking Industry Association)對(duì)RAID的定義,RAID是英文Redundant Array of Independent Disks的縮寫,中文意思是獨(dú)立磁盤冗余陣列。
這里有個(gè)小插曲,RAID一詞較早出現(xiàn)在1987年加利福尼亞大學(xué)伯克利分校David Patterson等人的論文中,是指“廉價(jià)磁盤冗余陣列(A Case for Redundant Arrays of Inexpensive Disks)”,研究的初衷是平衡當(dāng)時(shí)CPU快速的性能,當(dāng)時(shí)CPU效能每年大約增長(zhǎng)30-50%,而硬磁機(jī)只能增長(zhǎng)約7%。研究小組希望能找出一種新的技術(shù),于是RAID早期被用來整合大量廉價(jià)的硬盤,在短期內(nèi),立即提升效能來平衡計(jì)算機(jī)的運(yùn)算能力。但后來發(fā)現(xiàn),大量便宜磁盤組合并不能適用于現(xiàn)實(shí)的生產(chǎn)環(huán)境,后來Inexpensive被改為independent,RAID的定義變?yōu)榘S多獨(dú)立的磁盤組的冗余陣列,也就是我們?nèi)缃窨吹降臉幼印?/p>
RAID技術(shù)有什么好處呢?雖然RAID包含多塊硬盤,但是在操作系統(tǒng)下將其視為“一個(gè)”超級(jí)大盤。不難看出,RAID的本質(zhì)就是N個(gè)硬盤的虛擬化,對(duì)下層硬盤進(jìn)行扇區(qū)管理,對(duì)上層業(yè)務(wù)提供IO透明服務(wù)。
此時(shí),傳統(tǒng)RAID技術(shù)包含RAID0~RAID60等十多個(gè)規(guī)范,在實(shí)際應(yīng)用中使用較多的是RAID0、1、5、6、10、50、60等等。
傳統(tǒng)RAID誕生之初,曾給企業(yè)級(jí)存儲(chǔ)帶來巨大利好,體現(xiàn)在提高傳輸效率和容錯(cuò)能力兩個(gè)方面。在提高傳輸速率方面,傳統(tǒng)RAID技術(shù)通過在多個(gè)硬盤上同時(shí)存儲(chǔ)和讀取數(shù)據(jù)來大幅提高存儲(chǔ)系統(tǒng)的數(shù)據(jù)吞吐量。在RAID中,可以讓很多硬盤同時(shí)傳輸數(shù)據(jù),所以使用RAID能達(dá)到單個(gè)硬盤幾倍、幾十倍的速率。在數(shù)據(jù)容錯(cuò)方面,由于硬盤本身無法提供容錯(cuò),RAID容錯(cuò)是可提供較為完備的相互校驗(yàn)/恢復(fù)/鏡像等措施,提高了容錯(cuò)度和冗余性。
傳統(tǒng)RAID并不完美
傳統(tǒng)RAID技術(shù)重構(gòu)時(shí)間長(zhǎng),重構(gòu)期間數(shù)據(jù)可靠性保障差。在存儲(chǔ)系統(tǒng)正常運(yùn)行時(shí),傳統(tǒng)RAID技術(shù)的BUG并不明顯,但一旦遇到硬盤故障,需要數(shù)據(jù)重構(gòu)時(shí)卻存在較大的數(shù)據(jù)丟失風(fēng)險(xiǎn)。傳統(tǒng)RAID是以物理硬盤為單元,RAID重構(gòu)過程中數(shù)據(jù)沒有可靠性保障。這就是說,如果在傳統(tǒng)RAID重構(gòu)完成前出現(xiàn)壞盤就將造成數(shù)據(jù)丟失,不可恢復(fù)。令這一缺陷雪上加霜的是,傳統(tǒng)硬盤重構(gòu)的時(shí)間窗口比較大,進(jìn)一步加大了數(shù)據(jù)丟失的風(fēng)險(xiǎn)。以一塊2TB 7.2K rpm盤為例,重構(gòu)時(shí)平均寫入速度為30M/s左右,完成重構(gòu)時(shí)間長(zhǎng)達(dá)18個(gè)小時(shí)。
另外,傳統(tǒng)RAID一旦配置完成,組內(nèi)硬盤會(huì)鎖死,擴(kuò)容可能停機(jī)且較大擴(kuò)容盤數(shù)受限。在做存儲(chǔ)系統(tǒng)規(guī)劃時(shí),要求管理員準(zhǔn)確的計(jì)算出當(dāng)前每個(gè)單元業(yè)務(wù)的容量、IO需求,并評(píng)估每個(gè)單元業(yè)務(wù)未來發(fā)展的容量、性能要求;否則要么設(shè)計(jì)不足,存儲(chǔ)不能完全滿足業(yè)務(wù)需求,要么過度設(shè)計(jì)導(dǎo)致資源浪費(fèi)。配置完成后,RAID組內(nèi)硬盤鎖死。如果因?yàn)楦鞣N未預(yù)測(cè)到的變化需要調(diào)整原分配,那么只能通過手動(dòng)配置刪除和重新分配,以及復(fù)雜的數(shù)據(jù)遷入遷出來實(shí)現(xiàn)。值得一提的是,這一手動(dòng)調(diào)整RAID的過程,很多時(shí)候需要中斷業(yè)務(wù)。
浪潮InRAID:2+1數(shù)據(jù)虛擬化管理
浪潮智能存儲(chǔ)G2平臺(tái)基于InRAID技術(shù)變傳統(tǒng)RAID的固定管理模式為2+1數(shù)據(jù)虛擬化管理模式:1是指同一類型的硬進(jìn)行1次RAID分組;2是指硬盤的兩層虛擬化,第一層是硬盤切分為KB級(jí)邏輯塊,第二層是不同類型硬盤的多個(gè)邏輯塊構(gòu)成一個(gè)LUN。通過“2+1”數(shù)據(jù)虛擬化管理(2次硬盤邏輯化+1次用戶態(tài)虛擬化),實(shí)現(xiàn)硬盤資源池化。
首先,2是指完成兩次硬盤的邏輯化和虛擬化。
第一次:硬盤RD化
1) 對(duì)于系統(tǒng)內(nèi)部物理硬盤,按介質(zhì)的性能不同分配不同的Disk&LUN,包括SAS SSD、RI SSD(讀取密集型SSD)、SAS HDD、SAS NearLine HDD(SAS協(xié)議的近線磁盤)四類存儲(chǔ)存儲(chǔ)介質(zhì)。
2) 將系統(tǒng)內(nèi)部每種不同類型的存儲(chǔ)介質(zhì)按一定數(shù)量劃分為邏輯上的RD(RAID)。
第二次:KB級(jí)邏輯塊
3) 將不同硬盤上按RAID組成Mdisk。
4) 將Mdisk切分成16MB-8GB,默認(rèn)1GB(大小可配置)的更細(xì)粒度邏輯塊(Extent)。
其次,1是指完成一次面向用戶態(tài)的共享卷構(gòu)建。
5) 按需將1-N個(gè)更細(xì)粒度邏輯塊(Extent)組成卷(Volume)/文件(File)。
這里打個(gè)形象的比方,上述過程可以用包餃子做個(gè)簡(jiǎn)單生動(dòng)的解釋。1-4步驟是剁餡兒,包括一系列備料、切、剁等流程,提供對(duì)硬盤的邏輯化和虛擬化;步驟5是拌餡兒,提供面向用戶態(tài)的數(shù)據(jù)服務(wù)。
InRAID的價(jià)值:重構(gòu)快10X、擴(kuò)容增5X、閃存優(yōu)化快40%
相比傳統(tǒng)RAID,浪潮InRAID技術(shù)帶來的好處顯而易見。
首先,重構(gòu)效率提升10X。
當(dāng)一個(gè)邏輯塊故障時(shí),重構(gòu)的僅是一個(gè)邏輯塊大小的數(shù)據(jù),1-3秒即可完成重構(gòu)。
當(dāng)一個(gè)物理硬盤故障時(shí),RAID組內(nèi)所有硬盤參加重構(gòu)。還以上邊的2TB 7.2K rpm盤重構(gòu)為例,用浪潮InRAID重構(gòu),每TB重構(gòu)小于30分鐘完成(傳統(tǒng)RAID下每TB重構(gòu)需要9小時(shí)),2TB重構(gòu)時(shí)間縮短至1小時(shí)內(nèi),重構(gòu)效率比傳統(tǒng)RAID提升10倍以上,大大降低重構(gòu)期間的硬盤失效概率。
其次,擴(kuò)容能力提升5X+。
InRAID和傳統(tǒng)RAID相比,承載主機(jī)IO的硬盤數(shù)量發(fā)生了變化,最多可承載128塊硬盤,比傳統(tǒng)RAID容量提升5倍以上。
此外InRAID不再配置閑置的熱備盤,所有盤都在處理IO,減少閑置熱備浪費(fèi)。
最后,基于InRAID的多線程,可提升閃存介質(zhì)性能。
浪潮G2 InRAID技術(shù)有多個(gè)線程處理IO,具備混合工作負(fù)載處理能力,可針對(duì)不同IO大小進(jìn)行并行處理,尤其對(duì)SSD的處理有很大的性能提升。寫IOPS性能可提升40%。
加載InRAID,助力浪潮智能存儲(chǔ)G2賣出2億+
自2017年2月發(fā)布后,僅半年多時(shí)間,浪潮智能存儲(chǔ)G2上市半年銷售額近2億,還獲得了兩個(gè)單項(xiàng)目千萬元級(jí)的大單,浪潮在企業(yè)級(jí)SAN存儲(chǔ)方面可以說遇到了過去幾年中發(fā)展較好的階段。能夠取得這一突破,一部分原因要?dú)w因于浪潮在InRAID等一系列存儲(chǔ)技術(shù)上的創(chuàng)新。
“InRAID穩(wěn)定性已經(jīng)歷市場(chǎng)充分驗(yàn)證,是G2產(chǎn)品默認(rèn)RAID配置。”浪潮資深產(chǎn)品經(jīng)理翟爽表示,“目前浪潮在統(tǒng)一存儲(chǔ),以及全固態(tài)存儲(chǔ)市場(chǎng)中是很有競(jìng)爭(zhēng)優(yōu)勢(shì)的。我們擁有IT領(lǐng)域唯一設(shè)在企業(yè)的國(guó)家重點(diǎn)實(shí)驗(yàn)室 -- 浪潮高效能服務(wù)器和存儲(chǔ)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,并擁有上百項(xiàng)存儲(chǔ)技術(shù)自主知識(shí)產(chǎn)權(quán),可根據(jù)用戶業(yè)務(wù)場(chǎng)景和需求進(jìn)行開發(fā)設(shè)計(jì),增加產(chǎn)品和應(yīng)用之間的結(jié)合度,這意味著我們的產(chǎn)品靈活性更高,更符合應(yīng)用實(shí)際需求,為用戶業(yè)務(wù)保駕護(hù)航?!?/p>