當前,大模型推理已成為算力需求的核心增長點。隨著 AI 技術的快速迭代,算力需求結構正發生深層次轉變 —— 從過去 70% 以上用于集中式訓練,轉向未來 70% 以上用于分布式推理。與此同時,國產化算力需求持續提升,全國國產卡占比已超 25%,其中國產卡中昇騰卡占比近 80%。然而,推理加速產業仍面臨多重挑戰:算力服務商與推理加速企業因信任壁壘難以深度合作;線下授權模式無法實現彈性擴縮容與動態計費;推理加速框架各自為戰、缺乏開源協同生態;異構算力資源調度與適配效率不足。
為此,由中國信通院牽頭與中國科技云、移動云、硅基流動共同成立“AI推理調度聯合體” ,針對上述痛點問題提出創新性解決方案,依托中立第三方身份與長期產業培育經驗,聯合各方構建 “技術協同 + 生態共建 + 商業共贏” 的合作模式,具體包括:
一是創新動態授權與計費機制。聯合體將基于中國信通院 License Server 搭建推理加速框架動態授權平臺,由硅基流動等優質推理加速企業提供不同芯片上的最優推理加速框架,通過 “動態授權碼” 助力算力服務商按需購買授權,降本增效,用戶可通過實際使用時長按需付費,實現彈性擴縮容、使用最優推理加速框架。實現用戶、算力提供商、推理加速提供商三方共贏的新生態!
二是構建開源協同生態。聯合體將以中國信通院算網云系統開放社區(CNCOS)為基礎,推動推理加速技術開源共享。基于開源推理加速框架 vLLM 及其優化方案,聯合攻關 CPU/GPU 異構協同推理、多模態推理等關鍵技術,同時制定統一的接口規范與適配標準,解決不同框架 “各自閉塞、無法互通” 的問題,讓算力服務商能為用戶提供 “芯片 - 框架 - 調度” 一體化的最優推理加速服務。
三是實現異構算力高效調度。依托中國信通院 AICOS 架構(AI 云操作系統)的資源管理與編排能力,聯合體將整合移動云、中國科技云等算力服務商的異構資源,通過跨域跨架構調度技術,實現大模型在不同芯片上的快速適配與高效部署,提升整體算力資源利用率。
此次 “AI 推理調度聯合體” 的成立,標志著我國算力互聯網在 “推理加速 + 生態協同” 領域邁出關鍵一步。通過整合技術、資源與生態優勢,聯合體將為 AI 產業發展注入新動能,為數字經濟高質量發展提供堅實的算力支撐。