omniture

上海交大廖秋承:超算競賽給大學生種下計算的種子

2020-10-29 14:36 5206

北京2020年10月29日 /美通社/ -- ASC世界大學生超算競賽是一場怎樣的比賽?對于擁有4參賽經(jīng)歷的廖秋承來說,ASC不僅是比賽,更是改變?nèi)松钠鯔C。非計算機專業(yè)出身的他因為ASC接觸超算,熱愛超算,從隊員成長為指導老師,更選擇將超算作為自己的終生事業(yè)。在今年初的ASC20啟動會上,廖老師作為指導老師代表發(fā)言,講述了他對ASC超算競賽的感悟和體會。

以下是廖秋承老師的演講實錄。

各位專家,各位老師,各位媒體朋友大家好。

我是上海交通大學代表隊的指導老師廖秋承。上海交通大學從2013年開始參加ASC,至今為止參加了七屆比賽,共獲得一個冠軍,一個亞軍,一個e Prize和4個應用創(chuàng)新獎。2020年是我個人第5年參加比賽,從一名隊員到一名指導老師,中間走過的路程激動人心又坎坷曲折。交通大學2013年建成國內(nèi)高校第一臺超級計算機π1.0,今年建成了π2.0,這個過程中無數(shù)科研成果從這兩臺超級計算機上誕生。包括中國第一個全國性的兒童早期白血病數(shù)據(jù)庫、目前世界上最大規(guī)模的4.3萬億個粒子N體問題模擬、比串行版本加速1.8萬倍的BTE算法等,很多重要的成果都有ASC競賽隊員的參與。

種下計算的種子

ASC不僅是讓大學生參加超算比賽、深刻了解超算的平臺,更為高校提供了人才培養(yǎng)機制,讓高校從中獲取高性能計算專業(yè)人才。我時常跟學生打比方,如果說戈登·貝爾獎和Top500是超算屆的達喀爾拉力賽和F1比賽,ASC就是超算界的卡丁車競賽。一個車手想成長為F1賽車手,他從非常小的時候就要接受卡丁車專業(yè)訓練,連續(xù)十幾年的時間里一直接受各種各樣的賽車訓練知識、引擎的知識,學習如何掌控重力、牽引力,輪胎管理和底盤管理等等。超算競賽就像卡丁車競賽,教會學生如何管理一個復雜系統(tǒng),從芯片微架構體系結構,到芯片間的互聯(lián),節(jié)點的互聯(lián),到操作系統(tǒng),調(diào)優(yōu)到建模。從來沒有一個比賽像ASC比賽這樣,把所有方面全部結合在一起,這也給學生帶來非常大的挑戰(zhàn)。

根據(jù)我個人統(tǒng)計,每年可能有超過40名本科生在我們實驗室學習,但最后只有5個人的名字出現(xiàn)在ASC的獎狀上,這中間的淘汰機制非常殘酷,只有在這樣殘酷的條件下才有可能得到最優(yōu)秀的學生。超算競賽是一粒種子,給大學生種下了計算的種子,就像原始人拿到的第一個工具一樣,原始人拿到第一個手動工具之后開始開天辟地,而我們拿到算力以后開始改變世界,讓我們的生活變得更加美好。

廖秋承(右三)與隊友們獲得ASC16超算競賽亞軍
廖秋承(右三)與隊友們獲得ASC16超算競賽亞軍

讓學生發(fā)揮最大創(chuàng)造力

ASC不僅是播撒種子的平臺還是創(chuàng)新的平臺,上海交通大學代表隊在這幾年比賽中干過瘋狂的事情。2016年為DNN模型創(chuàng)建了18層的令牌環(huán),達到了決賽中苛刻的精度和速度要求。2017年我們第一次在PCIE SSD上使用了并行文件系統(tǒng)BeeGFS。2018年我們打磨了散熱器,更換了高性能的硅脂,改變服務器的散熱策略,使得我們在南昌大學酷熱的場地還能保持服務器的正常運行。2019年我們第一次在每一臺服務器節(jié)點上用了兩塊Omni-Path 100G的網(wǎng)卡,從而實現(xiàn)了全場最快的CESM模擬,當然因為一些原因我們的CESM并沒有拿到獎。

所以大家可以看到,ASC不僅是一個播撒種子的平臺,還是一個讓學生發(fā)揮他們最大創(chuàng)造力的平臺,你有非常多在正式生產(chǎn)集群上無法用的技能技巧和奇思妙想。雖然在ASC的賽場上,這些技巧并不會扭轉乾坤,甚至根據(jù)我的經(jīng)驗,它們大部分都失敗了,但是最后這些技巧越來越成熟后,卻有可能真正用在生產(chǎn)環(huán)境和高校的科研中。2019年π2.0幫助上海交通大學一位老師進行了北冰洋洋面和洋面下的氣候模擬,用的正是CESM的模型,他經(jīng)過我們的競賽隊員幫助,在π2.0集群上非常高效地完成之前無法運行起來的模擬。

今年我們第一次以超算工程師和學科主要科學家合作的模式,從零開始研發(fā)一個內(nèi)燃機摩擦學模擬程序,在研發(fā)成功后,這將是國際上摩擦學領域第一個二維滑動平面進行多尺度摩擦特性研究的程序。大家可以看到,ASC比賽不僅僅是讓學生玩得爽的比賽,還讓算力應用到日??蒲兄校尭咝:透黝I域學科的科學家都從中受益。

廖老師(左一)帶領上海交大超算隊獲得ASC19一等獎
廖老師(左一)帶領上海交大超算隊獲得ASC19一等獎

建立超算交流平臺

更重要的,ASC為我們建立一個交流的平臺,我記得去年我去SC,賽事主席Rebecca Hartman-Baker給我們說的第一句話是,你們這16個隊伍里有15個隊伍會輸。仔細想想確實是這樣,只有一個隊伍會贏,我們?yōu)槭裁催€要參加這個比賽?我說一個真實的故事,有一個大學是ASC的參賽代表隊,埃爾朗根紐倫堡大學,這個大學大家可能沒有聽說過,但是負責這個大學代表隊的實驗室兩位教授Gerhard Wellein和Gerog Hager,是高性能計算和芯片體系結構性能模型ECM的創(chuàng)始人,也是非常著名的高性能計算著作《Introduction to High Performance Computing for Scientists and Engineers》的作者,正是通過這個比賽,我們和他們有了很多的學術交流。

今年我們會看到ETH,非常著名的老牌大學來到中國,HPC領域著名的Torsten Hoefler教授就在他們的團隊里,他在去年SC拿到了戈登貝爾獎,也拿到了Best Paper,如果他們今年能來到中國,希望我們很多代表隊有機會和這樣一位大師能夠面對面的交流。

綜合以上,我想說ASC不僅僅給我們帶來無數(shù)的榮譽,無數(shù)的歷練,無數(shù)的精彩,還給我們整個高性能計算的生態(tài)圈注入了新鮮的血液。今年的題目里有一個題“QuEST”,使我想起了13年的同學,他是通過HPC比賽了解到HPC的相關知識,目前在從事量子計算的研究。有無數(shù)的學生從ASC里發(fā)現(xiàn)了計算的潛力,在各個行業(yè),有的去了金融公司,有的去了互聯(lián)網(wǎng)公司。這是一棵大樹,希望我能和浪潮、亞洲超算協(xié)會和其他為這項比賽辛勤付出的人一起,把這棵大樹慢慢培養(yǎng)長大,最后長成參天大樹,讓全人類都享受到計算帶來的強大力量。

謝謝大家。

消息來源:ASC亞洲超算協(xié)會
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection