浪潮智能全閃存存儲G2-F實(shí)現(xiàn)SSD固態(tài)硬盤寫放大<1

2018-01-25 02:23 6520

浪潮智能全閃存存儲產(chǎn)品G2-F依托自主研發(fā)的創(chuàng)新技術(shù)，實(shí)現(xiàn)全流程寫放大小于1，成為全閃存存儲領(lǐng)域的專家。

北京2018年1月25日電 /美通社/ -- SSD固態(tài)硬盤的容量和密度在不斷增加，以速度贏得人心的同時(shí)，擦寫壽命限制卻成為其短板，而寫放大是縮短SSD擦寫壽命的主要原因。如何破解寫放大難題，成為全閃存系統(tǒng)廠商的較大挑戰(zhàn)。浪潮智能全閃存存儲產(chǎn)品G2-F依托自主研發(fā)的創(chuàng)新技術(shù)，實(shí)現(xiàn)全流程寫放大小于1，成為全閃存存儲領(lǐng)域的專家。

SSD容量持續(xù)增長，寫入壽命卻不斷降低

SSD的容量增長速度驚人，在10TB的機(jī)械硬盤剛出來不久，一波閃存廠商就將SSD的容量做到了單盤30TB、60TB甚至100TB。SSD的單盤容量大有趕超機(jī)械盤的態(tài)勢，這得益于NAND工藝制程的進(jìn)步與單位面積存儲密度的提升：NAND制程已經(jīng)從最開始的90nm下降到當(dāng)前的10nm，NAND工藝已經(jīng)完成從2D NAND到3D NAND的完美切換，3D NAND的層數(shù)更是逐年增加：24層，32層，48層，64層，一直到96層。工藝的提升帶來存儲密度的大幅度提升。

在SSD容量密度增加的同時(shí)，伴隨著單位容量成本的下降，這對用戶來說無疑是喜事。但是SSD還有一個(gè)不容忽視的指標(biāo)，那就是壽命。對于最新的3D TLC、3D QLC的大容量盤，其擦寫壽命限制成為不容忽視的弱點(diǎn)。

在SSD盤容量增大的同時(shí)，寫入壽命的問題非但沒有得到有效解決，反而呈現(xiàn)下降趨勢。早些年的企業(yè)級SLC、MLC盤的DWPD(Diskful Writes Per Day ，每日整盤寫入次數(shù))是10，而最新推出的3D TLC的SSD的DWPD為0.35。DWPD是確保SSD在生命周期內(nèi)（3年或者5年）每天能夠?qū)ΡP進(jìn)行全量寫入次數(shù)的指標(biāo)。DWPD為10是指著每天對SSD全量寫入10遍，能保證SSD在5年之內(nèi)不會發(fā)生磨損耗盡。而DWPD為0.35意味著，每天寫入量不能超過盤容量的0.35，否則盤堅(jiān)持不了5年就會因?yàn)榻橘|(zhì)磨損而發(fā)生故障。這樣的弱點(diǎn)讓用戶無法不對應(yīng)用全閃存存儲系統(tǒng)心存疑慮。

全閃陣列廠商面臨的關(guān)鍵挑戰(zhàn)

當(dāng)SSD的寫入壽命隨著存儲密度提升而下降成為用戶的心頭之痛，如何能夠提供可靠的全閃存存儲，便成為全閃陣列廠商所面臨的關(guān)鍵問題。

有人可能會說，繼續(xù)使用DWPD為10的SSD不就可以了？答案是否定的：一方面DWPD為10的SSD成本非常高，相同容量是DWPD為1的SSD的數(shù)倍，另一方面高DWPD的SSD的產(chǎn)量在逐漸縮小，再過幾年，DWPD為10的SSD甚至可能面臨停產(chǎn)。下圖是閃存領(lǐng)導(dǎo)廠商三星關(guān)于SSD DWPD的預(yù)測報(bào)告，從報(bào)告可以看出，2018DWPD為10的SSD占比已經(jīng)小于5%。如果全閃陣列一定要使用DWPD為10的SSD，未來幾年的選擇會越來越少。

寫放大這個(gè)詞從事存儲行業(yè)的應(yīng)該都不陌生，在磁盤陣列上就存在。但為什么到了全閃陣列上，寫放大就成了一個(gè)關(guān)鍵指標(biāo)？一方面，磁盤是沒有寫入壽命問題的，所以在磁盤陣列上寫放大只和性能相關(guān)，和可靠性關(guān)系不大；而在全閃存儲上，由于閃存存在寫入壽命限制問題，寫的越多壽命就越低，所以寫放大直接和全閃陣列的可靠性相關(guān)；另一方面，全閃陣列上的寫放大，遠(yuǎn)不止RAID寫放大一個(gè)因素，例如，隨機(jī)寫入帶來的SSD上垃圾回收導(dǎo)致的數(shù)據(jù)遷移，也會給引入巨量的寫放大。

面對這樣的挑戰(zhàn)，浪潮存儲作為國內(nèi)領(lǐng)先的數(shù)據(jù)存儲廠商，早在5年前就大力投入全閃存存儲系統(tǒng)的研發(fā)，并在兩年前實(shí)現(xiàn)革命性突破，徹底解決了全閃存存儲的寫放大問題。2017年10月，浪潮發(fā)布智能全閃G2-F多款型號的閃存陣列，實(shí)現(xiàn)全流程寫放大小于1，相對于傳統(tǒng)磁盤陣列I/O棧，寫放大降低15倍。

如此強(qiáng)大的黑科技是如何實(shí)現(xiàn)的呢？其背后的技術(shù)原理又是什么？

技術(shù)1：基于時(shí)間點(diǎn)的變長實(shí)時(shí)壓縮

傳統(tǒng)的數(shù)據(jù)壓縮方法是基于固定塊大小的，輸入必須是固定大小的對齊數(shù)據(jù)塊，輸入不對齊時(shí)，需要補(bǔ)齊讀，影響效率；壓縮后輸出的數(shù)據(jù)塊大小不一致，需要補(bǔ)零填充對齊，浪費(fèi)空間；對壓縮后的數(shù)據(jù)進(jìn)行少量更新時(shí)，必須對整個(gè)數(shù)據(jù)塊進(jìn)行“解壓數(shù)據(jù)塊-更新數(shù)據(jù)-壓縮數(shù)據(jù)塊”，效率低。

浪潮全閃存存儲采用基于時(shí)間點(diǎn)的變長實(shí)時(shí)壓縮技術(shù)，解決傳統(tǒng)的固定塊大小壓縮的缺點(diǎn)，主要設(shè)計(jì)包括：

小塊變長輸入：不限定輸入數(shù)據(jù)塊的大小，以用戶下發(fā)的數(shù)據(jù)為單位進(jìn)行壓縮處理，用戶數(shù)據(jù)的長度即是壓縮輸入的長度，不需要補(bǔ)齊讀；
大塊定長輸出：壓縮處理后，在內(nèi)存中聚合數(shù)據(jù)，達(dá)到一個(gè)固定塊大小時(shí)，將數(shù)據(jù)整塊寫盤，保證輸出數(shù)據(jù)塊大小一致，不需要補(bǔ)零填充；
追加寫更新：更新壓縮數(shù)據(jù)時(shí)，更新數(shù)據(jù)和新寫入數(shù)據(jù)一樣處理，仍然采用基于時(shí)間點(diǎn)的壓縮，將新數(shù)據(jù)追加寫入，舊數(shù)據(jù)后臺回收。覆蓋寫時(shí)，僅壓縮寫入的小塊數(shù)據(jù)，避免頻繁“解壓數(shù)據(jù)塊-更新數(shù)據(jù)-壓縮數(shù)據(jù)塊”的過程，提高性能；
時(shí)間點(diǎn)親和性：用戶同時(shí)寫的數(shù)據(jù)，大概率會同時(shí)讀，基于時(shí)間點(diǎn)的壓縮將同一時(shí)間點(diǎn)寫入的數(shù)據(jù)放到同一個(gè)數(shù)據(jù)塊存放，cache預(yù)讀命中率大幅提升；
專用的硬件壓縮卡加速：釋放CPU資源，保障關(guān)鍵應(yīng)用的響應(yīng)時(shí)間；

通過以上優(yōu)化，浪潮存儲基于時(shí)間點(diǎn)的變長實(shí)時(shí)壓縮技術(shù)，整體提供高達(dá)5倍壓縮效率，減少數(shù)據(jù)的寫入量，有效的減少了對SSD資源占用，提升全閃存儲系統(tǒng)的使用壽命。

技術(shù)2：順序?qū)懱娲S機(jī)寫追加寫替代覆蓋寫

RAID的寫放大是由于隨機(jī)寫造成的，隨機(jī)寫入的時(shí)候，由于RAID不是滿條帶的，每一個(gè)小塊的數(shù)據(jù)寫入都需要更新校驗(yàn)數(shù)據(jù)，RAID6需要則更新兩個(gè)校驗(yàn)數(shù)據(jù)，因此導(dǎo)致了更大倍數(shù)的寫放大。但如果是順序?qū)懭刖筒灰粯恿?，多個(gè)順序I/O可以合并成一個(gè)滿的條帶寫入，一個(gè)滿條帶進(jìn)行一次校驗(yàn)數(shù)據(jù)P的更新，其寫放大幾乎可以忽略。

開啟實(shí)時(shí)壓縮時(shí)，G2-F對原有數(shù)據(jù)的修改寫不會在原來的地址上進(jìn)行覆蓋寫，而是將數(shù)據(jù)順序地追加寫入到后面的地址上，然后標(biāo)記前面被覆蓋寫的數(shù)據(jù)為無效。由于沒有覆蓋寫，所以SSD上的block上不會出現(xiàn)空洞。而通過持續(xù)的順序追加寫，浪潮的全閃存存儲可以使SSD盤內(nèi)部5倍的寫放大降低到1，基本消除SSD內(nèi)部的寫放大。

技術(shù)3：全局主動垃圾回收

開啟實(shí)時(shí)壓縮時(shí)，浪潮全閃存存儲向SSD的寫入模式都是順序追加寫入，通過順序追加寫入消除RAID和SSD內(nèi)部的寫放大。但是持續(xù)的順序追加寫入必然會導(dǎo)致空間快速耗盡，要獲得新的空間寫入，就必須要對前面無效數(shù)據(jù)占用的空間進(jìn)行整理。為解決這一問題，浪潮使用全局主動垃圾回收 (Garbage Collection) 技術(shù)來進(jìn)行無效空間的整理。垃圾回收程序會在全閃陣列的所有SSD上進(jìn)行掃描，找出系統(tǒng)中最空閑的block進(jìn)行回收。如果空閑的block上沒有有效的用戶數(shù)據(jù)，則直接以block的粒度回收，若空閑block上仍然有有效用戶數(shù)據(jù)，則垃圾回收程序會將這些有效數(shù)據(jù)進(jìn)行遷移，待遷移完成后再回收?；厥盏臅r(shí)候，先使用trim命令通知SSD（如果不通知SSD直接進(jìn)行寫入，在SSD側(cè)看到的將是一個(gè)覆蓋寫入，因此會導(dǎo)致寫入空洞，帶來寫放大），這樣做的目的就是為了避免SSD內(nèi)部垃圾回收帶來的寫放大。

多項(xiàng)黑科技成就小于1倍的寫放大

有了這些創(chuàng)新技術(shù)，浪潮智能全閃G2-F實(shí)現(xiàn)了寫放大<1,也使得浪潮智能全閃G2-F具有更高的性能、穩(wěn)定性、可靠性，閃存盤能夠得到更好的保護(hù)，其平均使用壽命提高至5年以上。數(shù)據(jù)顯示，浪潮智能全閃G2-F系統(tǒng)性能較大可達(dá)260萬IOPS，并實(shí)現(xiàn)了6個(gè)9的企業(yè)級存儲可靠性，是用戶關(guān)鍵業(yè)務(wù)存儲系統(tǒng)的合適選擇。

消息來源：浪潮集團(tuán)