omniture

浪潮存儲:挖掘NAND潛力,打造高可靠閃存盤

2022-06-28 11:17 3996

北京2022年6月28日 /美通社/ -- 隨著企業(yè)數(shù)字化轉(zhuǎn)型的快速發(fā)展,數(shù)據(jù)呈現(xiàn)爆發(fā)增長趨勢,大數(shù)據(jù)、云計(jì)算、AI等新興技術(shù)的發(fā)展使得數(shù)據(jù)來源和結(jié)構(gòu)變得更加復(fù)雜多樣,基于數(shù)據(jù)的智慧應(yīng)用不斷涌現(xiàn),帶來了對數(shù)據(jù)存儲質(zhì)量、傳輸速度等性能需求的提升。固態(tài)硬盤憑借著高性能及其價格的持續(xù)優(yōu)化、綠色節(jié)能的特點(diǎn),成為了IT核心基礎(chǔ)設(shè)施重要選擇,滿足數(shù)字經(jīng)濟(jì)時代對高性能、高可靠、容量、綠色節(jié)能的需求。NAND Flash作為SSD閃存盤的基礎(chǔ)單元,就像是超市內(nèi)部的貨架,其可靠性是存儲系統(tǒng)、數(shù)據(jù)中心穩(wěn)定可靠的基礎(chǔ)保證,浪潮存儲堅(jiān)持科技創(chuàng)新與工匠精神,結(jié)合用戶的場景要求,針對NAND Flash可靠性測試進(jìn)行了全方位的探索和創(chuàng)新,不斷打磨優(yōu)化確保SSD的高可靠性

提升NAND可靠性  需要闖過“三關(guān)”

浪潮存儲基于大量的NAND測試數(shù)據(jù),在反復(fù)探索和實(shí)踐推理過程中發(fā)現(xiàn)了企業(yè)級固體硬盤普遍面臨三個挑戰(zhàn):

首先,NAND特性會影響數(shù)據(jù)的可靠性。例如NAND中未寫滿數(shù)據(jù)的塊因數(shù)據(jù)保存能力低會導(dǎo)致RBER ( Raw Bit Error Rate,原始比特錯誤率)升高,經(jīng)過大規(guī)模NAND測試和數(shù)據(jù)分析,量化不同階段影響程度,可以制定出最優(yōu)方法去減少影響并提升固體硬盤的可靠性。

其次是默認(rèn)讀電壓未能最佳適配NAND特性不能滿足QoS(Quality of Service,服務(wù)質(zhì)量)要求。大量實(shí)際業(yè)務(wù)讀寫場景中5K P/E(Program/Erase,寫入/擦除)下數(shù)據(jù)保存能力達(dá)到90天時就嚴(yán)重超出了LDPC(Low Density Parity Check Code,低密度奇偶校驗(yàn))糾錯能力,所以NAND測試需給出最優(yōu)電壓來滿足服務(wù)質(zhì)量要求;

第三是NAND廠商提供的Read Retry表如果不夠精細(xì),不經(jīng)實(shí)際測試校驗(yàn)檢測使用會影響產(chǎn)品的服務(wù)質(zhì)量。

全面NAND Flash測試為產(chǎn)品優(yōu)化提供精準(zhǔn)數(shù)據(jù)

浪潮存儲的研發(fā)團(tuán)隊(duì)在研究分析全球主流NAND Flash所有特性后,針對NAND Flash測試分析制定了測試流程,并研發(fā)了一款測試分析儀,能給為產(chǎn)品的優(yōu)化提供詳細(xì)數(shù)據(jù),提升SSD的可靠性。

第一步是原廠屬性核驗(yàn),主要核驗(yàn)原廠所提供的Timing、壞塊等原廠屬性數(shù)據(jù)的一致性和偏差閾值;第二步是NAND Flash特性極值摸底挖掘,主要是摸底First Read、最優(yōu)讀取電壓等屬性的極值;第三步是最優(yōu)讀電壓的驗(yàn)證和優(yōu)化以及LLR Table(Log likelihood ratio table,對數(shù)似然比表)的生成,考慮到同型號不同批NAND也存在部分細(xì)微差異,對同一型號每一批次NAND Flash都要進(jìn)行充分驗(yàn)證以保證測試數(shù)據(jù)的準(zhǔn)確性,為了更加全面準(zhǔn)確的獲取測試結(jié)果,浪潮存儲自主研發(fā)了NAND Prober HX9000測試分析儀。

NAND測試流程
NAND測試流程

NAND基礎(chǔ)屬性核驗(yàn)

在NAND基礎(chǔ)屬性測試方面,主要關(guān)注Timing時序、壞塊分布和功耗測試Power Consumption等測試項(xiàng)目。其中Timing測試中會在不同條件下測試讀、寫和擦,例如在不同PE、不同溫度、不同位置獲取最優(yōu)的Timing值給固件性能調(diào)優(yōu)提供基礎(chǔ)數(shù)據(jù);壞塊測試主要關(guān)注壞塊分布和壞塊率,為固件元數(shù)據(jù)設(shè)計(jì)以及性能一致性設(shè)計(jì)提供數(shù)據(jù);功耗測試針對讀寫擦,包含Single、Mulit-plane操作,獲取平均功耗和峰值功耗,峰值功耗是平均功耗的2~3倍,單個峰值持續(xù)時間微秒級別, 硬件需要針對電源及噪聲做設(shè)計(jì),固件可以限制并發(fā),避免大量峰值功耗涌現(xiàn)。

NAND特性極值挖掘

NAND基礎(chǔ)特性測試包含首次讀、未寫滿塊、空擦除、最優(yōu)讀電壓、LLR table等方面內(nèi)容,浪潮存儲正是基于對這些基礎(chǔ)特性的極值的探索,持續(xù)優(yōu)化產(chǎn)品,提升固體硬盤的可靠性。

在First Read方面的優(yōu)化,是考慮閃存顆粒中短時間不讀的數(shù)據(jù)塊(Block),第一次讀取時會存在BER(Bit Error Rate,比特誤碼率)會比較高的狀況,周期刷新可以有效的預(yù)防此類問題、通過測試驗(yàn)證不同溫度下的刷新周期和專用命令和pSLC dummy(portion Single Level Cell,部分單層存儲單元)命令有效性,刷新優(yōu)化不同型號NAND周期。

First Read圖譜
First Read圖譜

塊(Block)是NAND Flash中可的擦除的最小單位,由若干個可以讀寫數(shù)據(jù)的頁(Page)組成,這也意味著有些塊中會出現(xiàn)只有部分頁寫滿了數(shù)據(jù),但是系統(tǒng)為了保存這些頁內(nèi)的數(shù)據(jù)未對整個塊就行擦除,就出現(xiàn)了未寫滿的塊(Open Block), 在固件使用過程中不可避免。

塊與頁的構(gòu)成圖
塊與頁的構(gòu)成圖

相比寫滿數(shù)據(jù)的塊(Close Block),未寫滿塊的數(shù)據(jù)保存能力會降低。此部分測試的目標(biāo)就是要對不同寫入量數(shù)據(jù)塊進(jìn)行不斷的寫入和擦除,在不同情況下測試讀干擾和數(shù)據(jù)保持能力對可靠性的影響,探索能夠保障數(shù)據(jù)塊最強(qiáng)保存能力的最優(yōu)讀電壓和最佳的空擦除次數(shù),為FW設(shè)計(jì)開發(fā)優(yōu)化進(jìn)行指導(dǎo),從而實(shí)現(xiàn)NAND實(shí)現(xiàn)最高的可靠性。

獲取最優(yōu)讀電壓至關(guān)重要,因不準(zhǔn)確電壓會影響產(chǎn)品的性能吞吐量、QoS和UBER,主要有兩種方式可以獲取,一種是固定讀電壓離線獲取離線訓(xùn)練,F(xiàn)W使用相對簡單,但對NAND一致性要求較高;另一種是動態(tài)更新最優(yōu)讀電壓,F(xiàn)W要周期性找到最優(yōu)讀電壓,缺點(diǎn)是獲取過程中對Qos有影響,但通用性更好。根據(jù)不同型號的NAND一致性的實(shí)際數(shù)據(jù),可以選擇獲取最優(yōu)讀電壓的最佳方式。

參數(shù)表驗(yàn)證調(diào)優(yōu)

獲取最優(yōu)讀電壓參數(shù)后,仍需要進(jìn)行多輪的驗(yàn)證和優(yōu)化,包括基于實(shí)際NAND信道生產(chǎn)LLR table,LDPC 軟解碼的算法可以利用NAND Flash的數(shù)據(jù)和LLR table數(shù)據(jù)提升糾錯能力和性能。LLR生成的主要過程是通過NAND測試儀器生成LLR相關(guān)數(shù)據(jù),再采用專用LLR工具生成LLR table,然后將LLR table放到LDPC仿真環(huán)境中驗(yàn)證和產(chǎn)品的調(diào)優(yōu)。

LLR table生成過程
LLR table生成過程

為了快速、準(zhǔn)確、批量化測試分析NAND Flash各類特性,浪潮自主研發(fā)了高度模塊化的NAND Prober HX9000測試分析儀,支持SLC/MLC/TLC/QLC等多種存儲單元的閃存顆粒的NAND特性測試,具有高精準(zhǔn)、簡潔易用的用戶界面,可以滿足進(jìn)行閃存介質(zhì)特性分析、穩(wěn)定性追蹤、壽命檢測、算法優(yōu)化和測試等應(yīng)用,為產(chǎn)品的優(yōu)化提升了準(zhǔn)確性和效率。

浪潮存儲采用了行業(yè)領(lǐng)先的智能高溫控制器和自主創(chuàng)新的P/E 塊讀寫算法并行收集閃存介質(zhì)的實(shí)時狀態(tài),支持NAND介質(zhì)High Level、Low Level指令集,圖形化界面,全方位監(jiān)測介質(zhì)實(shí)時狀態(tài),通過開放的API(Application Programming Interface,應(yīng)用程序接口)接口,為用戶提供自定義的介質(zhì)特性控制、監(jiān)測和狀態(tài)數(shù)據(jù)收集服務(wù),設(shè)備購置和擁有成本有效的進(jìn)行了降低,通過使用NAND測試分析儀,提升了閃存主控芯片的設(shè)計(jì)、性能優(yōu)化、介質(zhì)壽命管控效率,有效提升主控芯片特性、優(yōu)化SSD整盤性能和可靠性,同時可以用于存儲介質(zhì)的新特性和新材料研究,支撐對傳統(tǒng)介質(zhì)新特性和新介質(zhì)新特性的測試、收集和分析,為未來產(chǎn)品的開發(fā)提供了重要支撐和保障。

NAND測試治具
NAND測試治具

可靠性提高30%以上

浪潮SSD通過嚴(yán)謹(jǐn)苛刻的測驗(yàn)優(yōu)化,產(chǎn)品的各項(xiàng)規(guī)格指標(biāo)已經(jīng)達(dá)到業(yè)界領(lǐng)先,再通過測試在不同PE、Retention、Read Disturb組合下去找最優(yōu)電壓,使得采用的NAND壽命和可靠性可以提高到30%以上,QoS水平可以達(dá)到99.99%,處于業(yè)內(nèi)領(lǐng)先水平,同時做到整個生命周期內(nèi)性能保持不變,用戶整體TCO降低20%以上。

浪潮在存儲基礎(chǔ)領(lǐng)域不斷下沉研發(fā)創(chuàng)新,將底層硬件關(guān)鍵核心部件技術(shù)與整機(jī)系統(tǒng)技術(shù)進(jìn)行結(jié)合,發(fā)揮閃存的高效、可靠、綠色的優(yōu)勢,結(jié)合客戶應(yīng)用場景,以技術(shù)創(chuàng)新優(yōu)化產(chǎn)品方案助力關(guān)鍵行業(yè)實(shí)現(xiàn)突破應(yīng)用,全面釋放數(shù)據(jù)價值,加速數(shù)字化轉(zhuǎn)型。

消息來源:浪潮信息
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection