超級(jí)計(jì)算正越來越成為一個(gè)國(guó)家科技創(chuàng)新核心競(jìng)爭(zhēng)力的重要方面,是推動(dòng)國(guó)家安全與創(chuàng)新發(fā)展的強(qiáng)力引擎,為解決國(guó)家安全、技術(shù)創(chuàng)新、經(jīng)濟(jì)發(fā)展和社會(huì)進(jìn)步等一系列重大挑戰(zhàn)性問題提供了不可替代的作用。
經(jīng)過近三十年的艱苦努力,我國(guó)超級(jí)計(jì)算機(jī)的研制水平和性能已經(jīng)居于全球領(lǐng)先水平,“天河二號(hào)”“神威·太湖之光”多次榮膺全球超算速度之冠,中國(guó)稱霸全球TOP500排行榜冠軍達(dá)創(chuàng)紀(jì)錄的五年之久。不過,2018年6月美國(guó)在五年之后重新奪回了世界第一的寶座。中美兩國(guó)進(jìn)入交替領(lǐng)跑世界超算的局面。
軟件跟不上發(fā)展
但在超算應(yīng)用水平方面,雖然2016年和2017年,基于神威·太湖之光的超算應(yīng)用“千萬核可擴(kuò)展大氣動(dòng)力學(xué)全隱式模擬器”和“非線性地震模擬”蟬聯(lián)“戈登貝爾獎(jiǎng)”,可實(shí)際上我國(guó)超算應(yīng)用發(fā)展還遠(yuǎn)遠(yuǎn)滯后于超算研制能力的發(fā)展。
其一,超算應(yīng)用軟件的可擴(kuò)展性偏低??萍疾客ㄟ^一系列重點(diǎn)研發(fā)計(jì)劃,在重點(diǎn)應(yīng)用領(lǐng)域部署了一系列課題,進(jìn)行幾十萬核乃至百萬核并行算法與軟件研制的重點(diǎn)突破,但目前日常運(yùn)行的大部分超算作業(yè),其并行規(guī)模仍停留在幾千或幾萬個(gè)處理器甚至更低的量級(jí),沒有充分發(fā)揮出億億次超級(jí)計(jì)算機(jī)上并行的能力。我國(guó)應(yīng)用軟件仍處于初級(jí)階段,應(yīng)用領(lǐng)域與軟件研發(fā)存在脫軌現(xiàn)象。
其二,受制于國(guó)外壟斷,國(guó)產(chǎn)商業(yè)應(yīng)用軟件發(fā)展滯后,市場(chǎng)占有率幾乎是空白。在超算應(yīng)用比較多的制造業(yè)和基礎(chǔ)科研等關(guān)鍵領(lǐng)域,大部分商業(yè)應(yīng)用軟件都被國(guó)外壟斷。我國(guó)不僅支出巨額軟件采購費(fèi)用,軟件升級(jí)還受制于外方。我國(guó)超級(jí)計(jì)算機(jī)特別是國(guó)產(chǎn)超級(jí)計(jì)算機(jī)上運(yùn)行的大規(guī)模并行軟件幾乎都是科研用軟件,不具備大規(guī)模商業(yè)推廣的能力。
其三,我國(guó)超級(jí)計(jì)算機(jī)的研制模式一直以來都是政府科技部門主導(dǎo),地方政府參與,企業(yè)承擔(dān)研制任務(wù),國(guó)家超級(jí)計(jì)算中心負(fù)責(zé)運(yùn)維和推廣。雖然在過去二十多年里,我國(guó)超算的研制和發(fā)展在這一模式的指導(dǎo)下,取得了舉世矚目的輝煌成就,但為了取得TOP500世界冠軍而忽視實(shí)際需求,研制遠(yuǎn)遠(yuǎn)超過實(shí)際需求的機(jī)器的做法也越來越值得我們反思。
思想和人才的制約
我國(guó)超算應(yīng)用發(fā)展滯后的原因主要有以下四點(diǎn):首先,在建設(shè)思路上,采取了超算系統(tǒng)性能優(yōu)先發(fā)展再拉動(dòng)超算應(yīng)用發(fā)展的策略。歐美日等國(guó)家一般根據(jù)各領(lǐng)域?qū)嶋H應(yīng)用需求,針對(duì)性地研制能滿足實(shí)際應(yīng)用需求的超算系統(tǒng),能夠避免對(duì)機(jī)器的浪費(fèi)。而從實(shí)踐來看,我國(guó)的超算發(fā)展偏重于先發(fā)展超算計(jì)算能力,往往會(huì)導(dǎo)致超算系統(tǒng)的初期應(yīng)用效率偏低的情況出現(xiàn),需要一定時(shí)間的過渡期才能將機(jī)器用起來。
其次,“重硬輕軟”的思想導(dǎo)致經(jīng)費(fèi)投入比例嚴(yán)重失調(diào)。美國(guó)能源部建議的對(duì)超算軟硬件的投入比例約為1:1。據(jù)有關(guān)專家介紹,我國(guó)超算系統(tǒng)的軟件經(jīng)費(fèi)投入,在項(xiàng)目申報(bào)時(shí)已經(jīng)能占20%至30%,比過去的不到10%已經(jīng)有了明顯的改善,但是離1:1的比例還有很大差距。
再次,研發(fā)力量分散。我國(guó)超算應(yīng)用軟件的研發(fā)人員大部分分散在一些小的實(shí)驗(yàn)室、研究所,或者依附在以硬件研發(fā)為主的國(guó)家重點(diǎn)實(shí)驗(yàn)室,僅在核物理、石油、氣象、地球物理等個(gè)別領(lǐng)域建有專門的國(guó)家重點(diǎn)實(shí)驗(yàn)室,但是未形成合力。
最后,超算軟件人才嚴(yán)重匱乏。當(dāng)前高校相關(guān)人才培養(yǎng)體系、培養(yǎng)計(jì)劃和課程設(shè)置落后于超算應(yīng)用領(lǐng)域的人才需求。同時(shí),科研評(píng)價(jià)體系難以對(duì)超算應(yīng)用軟件研發(fā)做出客觀評(píng)價(jià),加上科研經(jīng)費(fèi)管理不利于體現(xiàn)軟硬件研究成果的不同價(jià)值,軟件研發(fā)人員待遇偏低但市場(chǎng)需求旺盛且待遇有明顯優(yōu)勢(shì),導(dǎo)致應(yīng)用軟件研發(fā)人才頻繁“跳槽”,人才流失嚴(yán)重。
多方努力補(bǔ)齊短板
為了解決現(xiàn)存問題,筆者建議:一是抓住歷史機(jī)遇,將我國(guó)超算的發(fā)展模式從超算機(jī)器性能拉動(dòng),向應(yīng)用需求拉動(dòng)轉(zhuǎn)變。隨著我國(guó)超算應(yīng)用軟件研制和應(yīng)用水平的不斷提升,二者的差距越來越小,為我國(guó)轉(zhuǎn)變發(fā)展模式提供了良好的歷史機(jī)遇。我們應(yīng)抓住這一機(jī)遇,探索出一條健康的超級(jí)計(jì)算系統(tǒng)發(fā)展道路。
二是成立若干國(guó)家級(jí)超算行業(yè)應(yīng)用軟件國(guó)家工程實(shí)驗(yàn)室。制定我國(guó)超級(jí)計(jì)算機(jī)應(yīng)用中長(zhǎng)期研究規(guī)劃和路線圖;當(dāng)前應(yīng)著力開展艾級(jí)(百億億次)應(yīng)用相關(guān)的基礎(chǔ)問題和關(guān)鍵共性技術(shù)研究。此外,中心應(yīng)以重大專項(xiàng)為牽引,集中多學(xué)科人才和資源,穩(wěn)定研發(fā)方向和人才隊(duì)伍。
三是轉(zhuǎn)變“重硬輕軟”思維,持續(xù)穩(wěn)定支持超算應(yīng)用軟件研發(fā)。根據(jù)超算軟件人才隊(duì)伍的實(shí)際發(fā)展情況和研發(fā)能力,適時(shí)調(diào)整財(cái)政支出結(jié)構(gòu),統(tǒng)籌協(xié)調(diào)全國(guó)超算研制計(jì)劃和經(jīng)費(fèi)安排,軟硬件經(jīng)費(fèi)投入比盡量做到30%以上,遠(yuǎn)期目標(biāo)希望做到1:1。
四是鼓勵(lì)國(guó)家超算中心聯(lián)合應(yīng)用部門組建行業(yè)應(yīng)用聯(lián)合實(shí)驗(yàn)室。實(shí)驗(yàn)室由行業(yè)應(yīng)用方的學(xué)科帶頭人領(lǐng)導(dǎo),國(guó)家超算中心提供高性能運(yùn)算支持并指導(dǎo)或協(xié)助進(jìn)行程序移植,自主研發(fā)大型并行應(yīng)用軟件,并通過應(yīng)用在用戶中培養(yǎng)人才。
五是重視計(jì)算科學(xué)學(xué)科建設(shè)和人才激勵(lì)機(jī)制。推廣“超算理論+多學(xué)科應(yīng)用”課程,促進(jìn)多學(xué)科交叉融合。對(duì)高水平超算應(yīng)用軟件科研人員實(shí)行兼職兼薪、協(xié)議薪酬等模式;采取內(nèi)外部結(jié)合的評(píng)價(jià)機(jī)制,給予超算軟件研發(fā)人員公平公正的評(píng)價(jià)和職務(wù)晉升通道。
六是加強(qiáng)人才隊(duì)伍的建設(shè),為超級(jí)計(jì)算的發(fā)展提供源源不斷的人才供應(yīng)。在全國(guó)院校推進(jìn)超級(jí)計(jì)算相關(guān)學(xué)科和課程的體系建設(shè),結(jié)合并行應(yīng)用挑戰(zhàn)賽等形式,為超級(jí)計(jì)算應(yīng)用領(lǐng)域培養(yǎng)更多更好的人才隊(duì)伍。
隨著云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈和邊緣計(jì)算等新一輪高新技術(shù)的快速推廣和普及,以超級(jí)計(jì)算為核心的算力經(jīng)濟(jì)學(xué)越來越成為衡量一個(gè)地方數(shù)字經(jīng)濟(jì)發(fā)展程度的代表性指標(biāo)。搭建超算和云計(jì)算平臺(tái),出臺(tái)超算扶植政策,培養(yǎng)超算人才和隊(duì)伍,將超級(jí)計(jì)算與大數(shù)據(jù)和人工智能等進(jìn)行深度融合創(chuàng)新,將成為進(jìn)行新舊動(dòng)能轉(zhuǎn)換的主要手段。
(作者張?jiān)迫?系中科院計(jì)算所研究員、國(guó)家超算濟(jì)南中心主任)