北京2018年2月5日電 /美通社/ -- 1月30日,由亞洲超算協(xié)會(huì)和浪潮集團(tuán)聯(lián)合發(fā)起的ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競賽在京正式啟動(dòng)18賽季(ASC18)。參加ASC18超算競賽的全球300多支隊(duì)伍,將在接下來的幾個(gè)月里,挑戰(zhàn)一項(xiàng)由微軟出具的極具挑戰(zhàn)性的人工智能賽題——機(jī)器閱讀理解。ASC18各參賽隊(duì)將使用CNTK深度學(xué)習(xí)框架,獨(dú)立開發(fā)機(jī)器閱讀理解和問答的算法模型,使用最新超算技術(shù)結(jié)合MS MARCO數(shù)據(jù)集進(jìn)行訓(xùn)練,以試圖讓機(jī)器更準(zhǔn)確地回答問題。
讓機(jī)器具備自然語言的閱讀理解與問答能力,是人工智能的核心難題之一,也是目前智能語音交互和人機(jī)對(duì)話的核心難題。一般來說,人們在讀完一篇文章之后能夠很輕而易舉地歸納出文章中的重點(diǎn)內(nèi)容,例如這篇文章講的是什么人、在什么地點(diǎn)、做了什么事情等。機(jī)器閱讀理解的研究就是賦予計(jì)算機(jī)與人類同等的閱讀能力,即讓計(jì)算機(jī)閱讀一篇文章,隨后讓計(jì)算機(jī)解答與文中信息相關(guān)的問題。這種對(duì)人類而言輕而易舉的能力,對(duì)計(jì)算機(jī)來說卻并非如此。很長一段時(shí)間以來,自然語言處理的研究都是基于句子級(jí)別的閱讀理解。例如給計(jì)算機(jī)一句話,理解句子中的主謂賓、定狀補(bǔ),誰做了何事等,但長文本的理解問題一直是研究的一個(gè)難點(diǎn),因?yàn)檫@涉及到句子之間的連貫、上下文和推理等更高維的研究內(nèi)容。
現(xiàn)在,包括微軟、卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)在內(nèi)的頂級(jí)人工智能專家和學(xué)者們正在研究這項(xiàng)復(fù)雜的任務(wù),這一目標(biāo)若能實(shí)現(xiàn),將意味著當(dāng)前的弱人工智能向強(qiáng)人工智能邁進(jìn)了一大步。在前不久的由斯坦福大學(xué)發(fā)起的SQuAD(Stanford Question Answering Dataset)文本理解挑戰(zhàn)賽的最新榜單上,微軟亞洲研究院自然語言計(jì)算組于2018年1月3日提交的R-NET模型在EM值(Exact Match, 表示預(yù)測答案和真實(shí)答案完全匹配)上以82.650的較高分領(lǐng)先,并率先超越人類分?jǐn)?shù)82.304。
而從ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競賽已經(jīng)發(fā)布的ASC18賽題可以看到,此次比賽采用的是一個(gè)更具難度的機(jī)器閱讀理解與問答數(shù)據(jù)集——微軟MS MARCO。這個(gè)數(shù)據(jù)集是基于Bing和Cortana上收集的真實(shí)數(shù)據(jù)構(gòu)建的,包括10萬個(gè)問題,100萬個(gè)段落,以及超過20萬個(gè)文件的鏈接。此次ASC18競賽的初賽階段,微軟將提供該數(shù)據(jù)集中的部分?jǐn)?shù)據(jù)供訓(xùn)練模型使用。而在決賽階段,微軟將提供一個(gè)全新的測試集來供選手們挑戰(zhàn)。同時(shí)為了更好的讓大學(xué)生入手和了解該賽題,微軟也同時(shí)提供基于CNTK的基準(zhǔn)代碼和相關(guān)論文作為參考。
此次ASC18人工智能賽題評(píng)判標(biāo)準(zhǔn)是基于各參賽隊(duì)訓(xùn)練模型的機(jī)器閱讀理解回答預(yù)測的準(zhǔn)確率,這就要求隊(duì)員們盡快學(xué)習(xí)掌握機(jī)器閱讀理解與問答的算法特點(diǎn),并熟練應(yīng)用CNTK深度學(xué)習(xí)框架。由于賽題的數(shù)據(jù)集規(guī)模較大,如何充分發(fā)掘利用超算硬件的計(jì)算潛力也成為贏得比賽的關(guān)鍵。這次ASC18的人工智能賽題要求參賽隊(duì)伍自己動(dòng)手開發(fā)機(jī)器閱讀理解的算法模型,運(yùn)用最新超算技術(shù)來加速訓(xùn)練速度及提高精度,更要用真實(shí)的問題數(shù)據(jù)集來驗(yàn)證模型訓(xùn)練的成果,這對(duì)處于本科階段的大學(xué)生參賽選手來說,無疑是一次“超級(jí)挑戰(zhàn)”。
ASC世界大學(xué)生超級(jí)計(jì)算機(jī)競賽(ASC Student Supercomputer Challenge)是由亞洲超算協(xié)會(huì)和浪潮集團(tuán)聯(lián)合發(fā)起的世界較大規(guī)模的大學(xué)生超算競賽,發(fā)韌于2012年,經(jīng)過7年發(fā)展,影響力不斷攀升。迄今為止,ASC 競賽已吸引到全球超過 5500 名年輕人才參與,參賽隊(duì)伍總數(shù)超過1100支。