英特爾深度神經(jīng)網(wǎng)絡(luò) 加速藥物研發(fā)新突破

英特爾

2018-06-14 20:05 11130

近日舉行的英特爾人工智能開(kāi)發(fā)者大會(huì)上，英特爾公司全球副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理Naveen Rao提到，英特爾正在與諾華合作，利用深度神經(jīng)網(wǎng)絡(luò)來(lái)加速高內(nèi)涵篩選 -- 這是早期藥品研發(fā)的關(guān)鍵因素。

北京2018年6月14日電 /美通社/ -- 在近日舉行的英特爾人工智能開(kāi)發(fā)者大會(huì)上，英特爾公司全球副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理Naveen Rao提到，英特爾正在與諾華合作，利用深度神經(jīng)網(wǎng)絡(luò)來(lái)加速高內(nèi)涵篩選 -- 這是早期藥品研發(fā)的關(guān)鍵因素。雙方的合作把訓(xùn)練圖片分析模型的時(shí)間從11個(gè)小時(shí)縮短到了31分鐘 -- 改善了20多倍¹。

細(xì)胞表型的高內(nèi)涵篩選是支持早期藥品研發(fā)的關(guān)鍵工具，“高內(nèi)涵”一詞是指利用傳統(tǒng)圖像處理技術(shù)從圖像中提取的豐富數(shù)據(jù)集，這些數(shù)據(jù)集由數(shù)千個(gè)預(yù)定義特性（如大小、形狀、肌理等）構(gòu)成。通過(guò)高內(nèi)涵篩選可以分析顯微鏡圖像，進(jìn)而研究數(shù)千種基因或化學(xué)治療方法對(duì)不同細(xì)胞的培養(yǎng)效果。

深度學(xué)習(xí)有望做到的是從數(shù)據(jù)中“自動(dòng)”學(xué)習(xí)如何通過(guò)相關(guān)圖像特征將一種治療方法與另一種治療方法區(qū)分開(kāi)。英特爾與諾華的生物學(xué)家和數(shù)據(jù)科學(xué)家希望通過(guò)利用深度神經(jīng)網(wǎng)絡(luò)加速技術(shù)，提高高內(nèi)涵圖像篩選的速度。在雙方的合作中，團(tuán)隊(duì)并非通過(guò)獨(dú)立的步驟鑒別出圖像中的各個(gè)細(xì)胞，而是聚焦于完整的顯微鏡圖像，但完整的顯微鏡圖像遠(yuǎn)遠(yuǎn)大于深度學(xué)習(xí)數(shù)據(jù)集里的圖像，例如英特爾與諾華合作評(píng)估中使用的圖片就比典型的動(dòng)物、物體和場(chǎng)景數(shù)據(jù)集ImageNet*中的圖像大26倍以上。

深度卷積神經(jīng)網(wǎng)絡(luò)模型在分析顯微鏡圖像時(shí)可同時(shí)分析一張圖像中的幾百萬(wàn)個(gè)像素或者一個(gè)模型中的幾百萬(wàn)個(gè)參數(shù)，甚至還能同時(shí)分析數(shù)千個(gè)訓(xùn)練圖像，這些構(gòu)成了很高的計(jì)算工作量，即使采用先進(jìn)的計(jì)算性能也無(wú)法有足夠時(shí)間對(duì)DNN模型展開(kāi)深入研究。為了解決這一挑戰(zhàn)，英特爾聯(lián)手諾華利用深度神經(jīng)網(wǎng)絡(luò)加速技術(shù)處理多個(gè)圖像，大大縮減了時(shí)間并提高工作效率，同時(shí)讓模型從圖像特性中獲得更加豐富的洞察。具體講就是通過(guò)使用Broad Bioimage Benchmark Collection* 021 (BBBC-021) 數(shù)據(jù)集，英特爾與諾華合作團(tuán)隊(duì)將總處理時(shí)間縮短至31分鐘，準(zhǔn)確率超過(guò)99%；利用深度學(xué)習(xí)訓(xùn)練中的數(shù)據(jù)并行性原則，并充分依靠服務(wù)器平臺(tái)上的大存儲(chǔ)支持，通過(guò)了32個(gè)TensorFlow* workers，實(shí)現(xiàn)了每秒處理120個(gè)3.9兆像素圖像的成果。

與諾華的合作，是英特爾通過(guò)企業(yè)級(jí)的解決方案為人工智能的應(yīng)用與企業(yè)部署提供最廣泛的計(jì)算力合作案例之一。在未來(lái)，雖然監(jiān)督學(xué)習(xí)對(duì)于加快圖像分類(lèi)、縮短獲得洞察的時(shí)間至關(guān)重要，但卻仍需要依賴(lài)大量專(zhuān)家標(biāo)記的數(shù)據(jù)集來(lái)訓(xùn)練模型，建立此類(lèi)數(shù)據(jù)集所需的時(shí)間和工作量往往超出現(xiàn)實(shí)條件。無(wú)監(jiān)督學(xué)習(xí)或許可以應(yīng)用于無(wú)標(biāo)記的顯微鏡圖像，有望在細(xì)胞生物學(xué)領(lǐng)域發(fā)現(xiàn)新洞察，有助于人類(lèi)藥物研發(fā)的進(jìn)一步發(fā)展。

¹20倍是通過(guò)從單節(jié)點(diǎn)系統(tǒng)擴(kuò)展到8插槽集群實(shí)現(xiàn)的21.7倍速度提升。

8插槽集群節(jié)點(diǎn)配置：CPU：英特爾®至強(qiáng)® 6148處理器（2.4GHz）；核心數(shù)：40；插槽數(shù)：2；超線程：?jiǎn)⒂?；?nèi)存/節(jié)點(diǎn)：192GB，2666MHz；網(wǎng)卡：英特爾® Omni-Path Host Fabric Interface （英特爾® OP HFI）；TensorFlow：v1.7.0；Horovod：0.12.1；OpenMPI：3.0.0；集群：ToR Switch：英特爾® Omni-Path Switch

單節(jié)點(diǎn)配置：CPU：英特爾®至強(qiáng)®融核處理器7290F；192GB DDR4 RAM；1x 1.6TB 英特爾® SSD DC S3610系列SC2BX016T4；1x 480GB 英特爾® SSD DC S3520系列SC2BB480G7；英特爾® MKL 2017/DAAL/Intel Caffe

消息來(lái)源：英特爾