omniture

從IT到DT,中科曙光支撐生命科學大數據的探索

2019-12-02 16:44 6524
中科曙光為生科院建設生物醫(yī)學大數據信息系統基礎平臺。

北京2019年12月2日 /美通社/ -- 生命科學是通過分子遺傳學為主,研究生命活動規(guī)律,從而達到治療診斷遺傳病、提高農作物產量、保護環(huán)境等目的。生命科學的數據來源和形式多樣,包括基因測序、分子通道、不同的人群等。技術的提升引領了IT到DT(數據時代)的變革,基于基因組數據量越來越多的情況下,生命科學大數據的發(fā)展前景將更加廣闊。利用信息技術將數據轉換成更好理解的基礎生命科學機制,其分析結果將給人類帶來更多福音。

計算和存儲是大數據研究中不可或缺的重要技術和支撐,生命科學大數據的研究也不例外。中國科學院上海生命科學研究院(以下簡稱:生科院),是國家級生命科學研究平臺,整體實力和技術水平處于國內領先。的領先除了生物技術之外,信息技術也扮演者重要的角色。在本次項目中,由曙光為生科院建設生物醫(yī)學大數據信息系統基礎平臺(以下簡稱:生物醫(yī)學大數據平臺)。平臺建成后將面向生命科學研究、生物醫(yī)藥研發(fā)、臨床醫(yī)學研究與應用,推動生物醫(yī)藥技術企業(yè)創(chuàng)新發(fā)展,支撐數據密集型科學研究和生物信息共享。

安全穩(wěn)定存儲系統,滿足生物醫(yī)學用戶需求

生物醫(yī)學數據的主要類型為文本文件、圖像文件、二進制文件等非結構化數據,對存儲的要求主要在存儲容量的大小和大文件讀寫通量的高低,此外少量的關鍵數據庫、索引等結構化數據,則對存儲的IOPS和穩(wěn)定讀寫能力要求較高。

未來,生物醫(yī)學大數據平臺將成為面向生物醫(yī)學大數據開放研究平臺,面向世界的國際數據交流接口和合作研究基地,海量生物醫(yī)學大數據資源的匯聚、管理和共享,數據的安全性至關重要。

兩地三中心架構,打造高可用生物醫(yī)學大數據平臺

生物醫(yī)學大數據平臺基礎設施由三個中心組成,分別為張江中心、岳陽路中心和貴州中心,每個中心都需要承載相關的業(yè)務系統。三個中心通過科技網鏈路相互連通,通過同城雙活、異地容災的兩地三中心架構,滿足生物醫(yī)學大數據平臺業(yè)務高可用和高穩(wěn)定性。


存儲系統作為本項目的重要建設內容,分別構建了業(yè)務系統存儲、高性能存儲和大容量存儲三類資源,滿足業(yè)務、計算和海量文件對存儲空間和性能的需求。

業(yè)務系統存儲采用高性能磁盤陣列,以滿足業(yè)務應用的需求;其中配備緩存加速技術滿足生物數據庫、云平臺等高I/O讀寫需求。系統配置一套ParaStor分布式存儲系統滿足海量非結構化生物基因數據的計算需求;其大容量存儲采用性價比高的分布式存儲,配置Infiniband接口,滿足基礎海量實驗數據的共享和離線備份的需求。

存儲系統在保障數據安全的同時還充分考慮的業(yè)務系統的穩(wěn)定運行。在備份系統建設上,采用曙光DBStor備份存儲系統和LTO5高速磁帶庫套件,支持異地容災和備份系統審計,通過磁帶異地存儲的方式實現了系統遠程容災。

通過多層次的存儲系統設計,方案滿足上海生科院生物醫(yī)學大數據平臺海量生物數據存儲、計算與共享需求,更具備遠程容災功能,實現生物醫(yī)學實驗數據的集中存儲、高效共享和安全保障。為生科院建立具有國際先進水平的科學研究綜合數據庫,提供了強有力的計算分析能力和信息安全保障。

消息來源:中科曙光
China-PRNewsire-300-300.png
醫(yī)藥健聞
微信公眾號“醫(yī)藥健聞”發(fā)布全球制藥、醫(yī)療、大健康企業(yè)最新的經營動態(tài)。掃描二維碼,立即訂閱!
collection