為落實國家五部委《關于深入實施“東數西算”工程 加快構建全國一體化算力網的實施意見》,中國移動在國家數據局指導下,全面參與全國一體化算力網監測調度先行先試工作。基于算力網絡科學裝置CFITI(CFN Innovative Test Infrastructure)的算力原生跨架構遷移和算網大腦能力實現全國一體化算力網監測調度平臺的跨主體、跨區域、跨架構算力并網和異構算力池化,推動構建全國算力“一張網”、“一盤棋”。同時,積極參與構建全國一體化算力網標準體系,主導編寫《全國一體化算力網 智能算力池化技術要求》和《全國一體化算力網 算力資源管理與調度技術要求》技術文件,助力實現異構算力資源的全局統籌與智能調度。本文重點解讀如何從算力并網和算力池化兩大核心方向全面助力全國一體化算力網高效建設。
為什么一體化算力網需要進行算力“并網”和“池化”?
全國一體化算力網作為數字經濟核心基礎設施,旨在通過整合多元異構算力實現資源高效調度、設施綠色低碳、算力靈活供給、服務智能隨需,主要面臨以下問題和挑戰:
一是“自建水井”太多,資源閑置嚴重: 算力資源建設分散孤立,“小作坊”遍地開花,缺乏統一調度。一邊是算力饑渴的AI大模型嗷嗷待哺,另一邊卻是大量算力設備閑置“曬太陽”,整體利用率亟待提升。
二是“度量衡”不統一,難以互通: 不同廠商的芯片(CPU、GPU、AI加速卡等),如同說著不同方言、使用不同貨幣。缺乏統一“度量衡”,導致異構算力資源難以抽象建模形成統一的共享資源池,無法高效整合和統一調用。
三是“技術小圈子”林立,各自為政: 不同硬件廠商構筑技術“護城河”,軟硬件深度捆綁。應用想跨平臺?難如登天!結果就是“小圈子”生態多而不強,用戶被鎖定,創新被束縛。
四是“遷移成本”高昂,國產化遇冷: 應用想換個“國產芯”?移植難度大、成本高,開發者望而卻步,“小圈子”生態難以突破壯大。
打通算力孤島,實現智算資源池化
為解決上述算力利用率低、異構算力統一度量、調度難,跨架構遷移難的問題,全國一體化算力網重點從算力并網和智能算力池化兩方面破局:
一方面通過算力并網打破算力孤島,廣泛接入樞紐節點和社會算力,通過網絡連接實現異屬異構異地的算力資源高效匯聚。通過制定開放統一API接口將分散在各地的算力中心(無論國家樞紐節點還是社會企業自建算力)通過高速網絡連接起來, 實現異屬(不同所有者)、異構(不同芯片架構)、異地(不同地理位置) 算力資源的可達和可用,推動算力資源便捷接入全國一體化算力網,破解算力孤島困局,為廣泛調度奠定基礎。
另一方面通過算力池化對匯入的五花八門算力資源進行“抽象”和“虛擬化”管理,形成統一、透明的“算力池”。通過先進的虛擬化、資源調度和抽象建模技術,一是屏蔽異構差異, 如同一個“萬能翻譯官”和“統一度量衡”,將不同芯片的性能、能力轉化為標準化的“算力單元”;二是資源池化管理,將物理上分散的算力,在邏輯上聚合成一個巨大的、可靈活切分的資源池;三是解耦硬件與應用,讓應用開發者無需關注底層芯片異構性,大幅降低開發復雜度和運維成本,支撐全國一體算力網實現資源按需分配,動態調度和應用自由遷移,讓算力服務像水電一樣便捷取用。
中國移動以算力并網筑基,以算力原生“芯合”平臺賦能全國一體化算力網
在算力并網方面,中國移動基于算力網絡試驗網CFITI共性開放創新環境,創新提出并驗證三種算力并網技術模式,聯動產、學、研、政推進超算并網、跨域并網調度等前沿技術驗證,依托協同創新基地,聯合新華三、曙光、浪潮、華為、亞信等合作伙伴創建算網協同服務子實驗室,形成1+N合作生態,實現中國移動百川并網平臺商用落地,當前中國移動已并網匯聚21家智算中心、3家國家級超算中心、3家量子計算中心算力資源。
在智能算力池化方面,中國移動已布局異構超融合技術體系-算力原生,攻克統一算力抽象、統一編程模型、跨架構遷移編譯優化、自適應運行、XPU算力資源統一調度及納管等關鍵技術,形成算力抽象、統一編程范式等系列標準,研發業內首個“芯合”異構超融合基礎軟件棧,當前已實現多樣異構算力資源的統一適配及納管和泛AI應用跨7家芯片廠商的一鍵式遷移部署,為支撐實現全國一體化算力網提供了有力支撐。
未來中國移動將加速推動算力并網和算力池化多路徑示范驗證和產業化規模應用,同時加大標準及開源投入,促進形成產業共識,全方位支撐全國一體化算力網建設和“東數西算”工程深入實施。