深圳2021年7月30日 /美通社/ -- 2021年7月13日,經(jīng)科技部批準(zhǔn)成立的第三方專業(yè)科技成果評(píng)價(jià)機(jī)構(gòu)中科合創(chuàng)(北京)科技成果評(píng)價(jià)中心,組織專家以視頻連線方式召開了科技成果評(píng)價(jià)會(huì),對(duì)承啟張弓教授團(tuán)隊(duì)完成的“全自主高性能高穩(wěn)健的核酸測(cè)序快速比對(duì)算法及云分析系統(tǒng)”進(jìn)行科技評(píng)價(jià)。經(jīng)過(guò)專家評(píng)審,F(xiàn)ANSe系列算法同時(shí)達(dá)到了極高計(jì)算速度與準(zhǔn)確性的雙重目標(biāo),具有超強(qiáng)的容錯(cuò)能力及遠(yuǎn)超傳統(tǒng)算法的實(shí)驗(yàn)可驗(yàn)證性,在解決“精準(zhǔn)醫(yī)學(xué)不精準(zhǔn)”的世界性難題上做出了重要的貢獻(xiàn)。作為可商用的基因數(shù)據(jù)底層比對(duì)核心技術(shù),其比對(duì)精度比歐美算法高出兩個(gè)數(shù)量級(jí),其云平臺(tái)的投入應(yīng)用得到了用戶的一致好評(píng),體現(xiàn)出良好的商業(yè)效益和社會(huì)效益。FANSe系列算法完全自主研發(fā),保障了中國(guó)的科研和精準(zhǔn)醫(yī)學(xué)的獨(dú)立自主性。評(píng)價(jià)專家組一致認(rèn)為,該項(xiàng)目具有很強(qiáng)的科學(xué)性、創(chuàng)新性和實(shí)用性,研究成果總體上達(dá)到國(guó)際領(lǐng)先水平。
這是國(guó)家權(quán)威機(jī)構(gòu)對(duì)FANSe的“官方認(rèn)證”。
目前,幾乎所有二代測(cè)序應(yīng)用需要進(jìn)行mapping(快速比對(duì)),鑒于所有生物學(xué)意義的分析都高度依賴于mapping的結(jié)果,尤其是存在于reads(短讀序列)中的錯(cuò)配結(jié)果,因此mapping的速度和精度都很重要。但速度與精度通常不可兼得,比如基于BWT原理的算法速度提升,但對(duì)錯(cuò)配的處理無(wú)法做到完美,在實(shí)際生物學(xué)應(yīng)用中容易導(dǎo)致假陰性和假陽(yáng)性問題,國(guó)際頂級(jí)科學(xué)雜志Nature斥之為“可重復(fù)性危機(jī)”(2012年)。2017年,JAMA Oncology雜志發(fā)布結(jié)果,將40份癌癥病人樣本送給兩家世界知名測(cè)序公司進(jìn)行測(cè)序,絕大部分樣本的兩份突變報(bào)告完全不同。因此二代測(cè)序技術(shù)在臨床上亂象叢生,難以保證高通量下的準(zhǔn)確性。
為此,張弓教授開始研發(fā)FANSe算法,力圖建立穩(wěn)健精準(zhǔn)的二代測(cè)序基礎(chǔ)技術(shù)。2011年,F(xiàn)ANSe1代研發(fā)成功,奠定了準(zhǔn)確穩(wěn)健的數(shù)學(xué)基礎(chǔ),錯(cuò)誤率可低至10-9以下,一定條件之下可以100%保證得到數(shù)學(xué)最優(yōu)解;2014年,FANSe2代研發(fā)成功,實(shí)現(xiàn)了并行化處理,同年開始部署在承啟生物的云平臺(tái)上;2015年起,高性能的FANSe3開始研發(fā),2017年開始在國(guó)際權(quán)威科學(xué)期刊上亮相,2018年首次實(shí)現(xiàn)了單機(jī)1小時(shí)全基因組、1秒鐘全轉(zhuǎn)錄組的驚人分析速度;2020年,云平臺(tái)專用的FANSe4代在承啟生物創(chuàng)造了單節(jié)點(diǎn)5分鐘分析完一個(gè)人全基因組測(cè)序數(shù)據(jù)集的新紀(jì)錄。由于其強(qiáng)悍的性能和全自主的特點(diǎn),F(xiàn)ANSe被作為科技部國(guó)家重點(diǎn)研發(fā)計(jì)劃《醫(yī)學(xué)生命組學(xué)數(shù)據(jù)質(zhì)量控制關(guān)鍵技術(shù)研發(fā)與應(yīng)用》核酸測(cè)序的底層算法,為組學(xué)領(lǐng)域的質(zhì)控標(biāo)準(zhǔn)貢獻(xiàn)關(guān)鍵力量。