<pre id="hll7j"><ruby id="hll7j"></ruby></pre>

        ?
         
        作者:鄭緯民 來源:中國科學報 發布時間:2022/8/12 10:03:49
        選擇字號:
        鄭緯民院士:這兩類算力適合建在西部

         

        鄭緯民<font class=

        鄭緯民院士  圖片來源:CCF

        有統計顯示,算力規模前20的國家,有17個是全球排名前20的經濟體??梢?,數字經濟發展水平與算力規模密切相關。有人說“得算力者得未來”,這話雖有些絕對,但不可否認,我們已進入算力時代。

        當前科學發現的四個范式——實驗驗證、理論研究、計算科學、大數據分析和AI計算處理中,第三和第四范式都與算力密切相關。但是,這兩種范式背后的算力不盡相同。

        一般認為,算力可分為三大類:高性能計算的算力(HPC算力或超算)、人工智能計算的算力(AI算力或智算)、數據中心的算力(通用算力)。在回答“哪類算力更適合建在西部”這個問題之前,需要了解這些算力的特點以及發展中面臨的難題。

        超算:“花樣”太多、應用移植和調優難度大

        超算是“國之重器”,它們被制造出來應對世界上最富有挑戰性的計算問題。我國超算發展很快,曾經有3臺超級計算機占據世界最快超算500強榜單(TOP500)榜首——這個數據美國是4臺、日本2臺??梢哉f,過去十年,我國在頂尖超算系統的研制和部署數量方面都處于國際領先行列。

        我國超算應用的情況也有很大進步。以高性能計算應用領域的國際最高獎“戈登貝爾獎”為例,過去十年,我國科學家依托國內頂尖超算系統,多次殺入戈登貝爾獎的評選,并在2016年首次摘獎。此后,2017年、2021年再次獲獎(編者注:2020年的戈登貝爾獎由中美科學家聯合團隊摘得,這支8人團隊中有7張中國面孔)。

        超算的問題在哪兒?現在超級計算機非???,但如何高效地將世界領先的計算能力高效轉化為解決尖端科學與工程難題的能力,依然是挑戰——這不是中國超算特有的問題,而是全世界都要面臨的問題,而且目前許多大型超算的建構選擇異構路線更加大了這一鴻溝。

        怎么辦?超算基礎軟件是提升轉換能力的關鍵之一。然而,超算軟件所面臨的環境并不好。

        目前,我國超算平臺架構多樣,應用移植和調優工作量大。目前國產超算有三類機器:神威、天河、曙光,都做得很好,但他們分屬不同架構,一個超算軟件,要從一臺機器移植到其他機器上就非常難,移植成本非常高。

        比如,社區大氣模式CAM5在“神威·太湖之光”上的移植和優化成本在10 人年以上,中科院大氣物理所高分辨率海洋模式LICOM3在某超算上的移植和優化成本也要 6-10人年。

        這背后的問題就在于,我們的超算“花樣”太多,種類太多。美國超算發展之初,也是百花齊放,現在基本上是CPU+GPU的異構高性能計算機。我們也要想辦法,比如,有沒有可能做一個跨平臺編譯優化平臺?平臺提供統一并行編程模型,程序員們可以在這個統一的并行編程模型和編譯優化平臺上編程、優化,降低開發復雜度的同時還可以跨平臺高效運行。當然,這需要研究。

        此外,國產超算平臺支持復雜應用全流程計算的能力亟待改善。簡單來講,現在一般的HPC應用之前,必須得有大數據處理,而前處理的機器跟后處理的機器還不是做HPC應用的機器,前后可能需要三臺機器。

        智算:面臨卡脖子風險

        2020年4月國家發改委明確將人工智能納入“新基建”范圍。此后人工智能算力成為熱門。AI計算機主要處理人工智能應用問題;發展也很快,國內也在建設很多智算中心。

        智算大概有三類應用:圖像檢測和視頻檢索、博弈決策類、自然語言處理。其中前兩類應用對國民經濟和信息安全保障等方面發揮了很大作用,但我認為它們都不需要太大的計算機。不過現在有多地都在建設智算,目前已有20個城市投建了人工智能計算中心,規模很大、價格不菲。我想如果它們被用來做自然語言處理還可以,如果只是前兩類應用,我認為不需要這么大的機器。

        自然語言處理類應用有4種:基于模型的語言翻譯、人機交互、文本生成摘要、關鍵詞創作。目前,AI正快速向大模型方向發展,因為參數數量增長很快,大概每3~4月就需要機器算力翻倍。鵬城實驗室的云腦二期,這臺機器能很好處理人工智能問題。

        我國人工智能產業快速發展,預計我國在2025年人工智能產業規模將超過4500億元,帶動產業規模超1.6萬億。據IDC數據統計,2017年到2021年,我國人工智能服務器市場規模每年翻倍增長。

        但要注意的是,我國人工智能企業面臨巨大卡脖子風險。2021年我國人工智能服務器芯片總出貨量100萬片,但國產芯片出貨量只有5萬片,95%依賴進口。此外,人工智能算法和深度學習框架,幾乎90%以上由別國開發。特別地,中國99.5%的在校理工科大學生學習的是國外的人工智能技術,學習自主人工智能技術的僅占0.5%。

        數據中心算力就不贅述了,科研的第四范式“數據分析”大部分由數據中心承載。

        目前,三類算力是分開的:HPC一臺、智能計算機一臺、數據中心又是一個地方。我希望“HPC+AI+大數據”能夠融整合。過去,高性能計算的程序從頭到尾,基本上都是解方程這些“普通玩法”,但如今HPC面臨的應用問題在中間可能會有AI計算需求。預計未來三五年后,計算機會把HPC、AI、大數據計算融合在一起。

        短臨天氣預報就是一個FABS(Fused AI BigData and Science,融合AI、大數據、科學計算)場景案例。它需要大數據處理,又需要HPC、AI融合在一起。目前的處理相對麻煩,預處理需要一臺機器,做高性能計算需要一臺機器,后處理還要需要一臺機器,因此融合是未來方向。

        “東數西算”:并網和調度是兩大難題

        “東數西算”的出發點是把東部的數據流動到西部存儲和計算。數據在東部產生比較多,都希望機器也在東部存儲、計算,但計算機不能全在東部,這不利于“碳達峰”“碳中和”。西部有土地資源和清潔能源,所以想到把存儲器建在西部。

        問題來了:哪些數據適合放在東部算、哪些適合在西部?一般來講,對實時性要求不高的可以到西部算,而對實時性要求高的,還得在東部,否則就做不了這件事。

        在三大算力類型中,HPC、AI算力建在西部是合適的。HPC 做天氣預報的計算,一算幾個鐘頭,中間也不必數據交換;AI模型的訓練一連幾天,這些都可以放在西部。

        但數據中心搬到西部可能不行,比如短視頻、電子游戲、網絡即時通訊等應用對實時性要求很高,無法忍受遠距離網絡傳輸帶來的時延。我們調查過幾個數據中心,它們80%~90%的機器在為這三類計算服務。

        “東數西算”戰略之下,算力網絡建設是應有之義。“算力網絡”就是把很多機器連在一起做事,但這件事做起來很費勁,主要有兩大困難:并網和調度。

        并網需要把算力連接起來,這不是簡單的網,需要帶寬高、延遲低——當然,只簡單連起來也無用。如果可以做到在北京打電子游戲的客戶,機器放在西部也能玩,滿足帶寬高、延遲低,能解決這個問題是可以的,但我認為很難。

        做調度也很難,難在哪?調度不是房屋租賃中介,只需要對接供需信息就夠了。打個比方,有個計算需求想用“神威·太湖之光”,但現在機器很忙,恰好中山大學的機器正空閑。把問題調度給中山大學超算上能不能行?有時候不行,這臺機器可能運行不了專門針對“神威·太湖之光”寫的軟件。

        類似的事情很麻煩。這些事并非無解,但要把并網和調度這兩件事同時做好,非常難。建議支持成立一個類似于“鏈家”的公司專門做調度。這家公司可以沒有計算機——就像鏈家沒有房子一樣,但可以專門做好調度。

        總結一下我國算力發展面臨三大問題。第一,國產超算平臺架構多樣,應用移植和調優工作難度大。第二,國產算力平臺支持復雜應用全流程計算的能力亟待改善。第三,人工智能企業面臨巨大卡脖子風險。

        最后提出四個建議。第一,加強跨平臺編譯優化研究建設。第二,加強國產超算HPDA系統的軟件研發,使計算與大數據處理能夠融合在一起。第三,建議定義自主人工智能產品(如國產AI芯片和學習框架),出臺措施鼓勵行業加速使用。第四,加強HPC、AI、大數據三類計算系統的融合研究。

        (作者系中國工程院院士、清華大學計算機系教授,本報記者趙廣立受權根據其在信息化百人會第八屆信息戰略論壇上的發言整理)

         
        版權聲明:凡本網注明“來源:中國科學報、科學網、科學新聞雜志”的所有作品,網站轉載,請在正文上方注明來源和作者,且不得對內容作實質性改動;微信公眾號、頭條號等新媒體平臺,轉載請聯系授權。郵箱:shouquan@stimes.cn。
         
         打印  發E-mail給: 
            
         
        相關新聞 相關論文
        ?
        圖片新聞
        百兆瓦先進壓縮空氣儲能電站并網發電 在離太陽更近的地方
        全球最大液流“電力銀行”10月上線 我國成功實施問天實驗艙轉位
        >>更多
         
        一周新聞排行
         
        編輯部推薦博文
         
        裸体按摩XXXXX高清

            <pre id="hll7j"><ruby id="hll7j"></ruby></pre>