近日,在2024云網(wǎng)智聯(lián)大會上,中國移動研究院網(wǎng)絡(luò)與IT技術(shù)研究所異構(gòu)計算基礎(chǔ)軟件系統(tǒng)專家解子巖受邀參加算力網(wǎng)絡(luò)/算力基礎(chǔ)設(shè)施分論壇,以《算力原生助力多元算力釋放協(xié)同效能》為主題發(fā)表演講,系統(tǒng)闡述以算力原生基礎(chǔ)軟件技術(shù)屏蔽異構(gòu)算力底層差異、使能多元算力一體協(xié)同運用的技術(shù)路徑,以及芯合1.0在此領(lǐng)域的產(chǎn)業(yè)實踐成果。
以大模型為驅(qū)動的新一代生成式人工智能技術(shù)推動生產(chǎn)力跨時代變革的同時,帶來對高性能算力規(guī)模需求的激增,據(jù)預(yù)測,Transformer類大模型的訓(xùn)推算力需求將以每兩年擴大275倍的速度指數(shù)級遞增,傳統(tǒng)單一類型、單點部署的基礎(chǔ)設(shè)施難以滿足發(fā)展需求,亟需算力網(wǎng)絡(luò)體系化集結(jié)泛在的多元計算系統(tǒng),形成靈活一體的算力服務(wù)能力,隨時隨需為AI+行動賦能,加速數(shù)字經(jīng)濟創(chuàng)新發(fā)展。
隨著近年多樣化異構(gòu)智算芯片涌現(xiàn),產(chǎn)業(yè)界形成了多套AI框架+工具鏈+硬件的軟硬一體豎井生態(tài),上層應(yīng)用與底層智算芯片深度綁定,帶來應(yīng)用開發(fā)遷移成本高昂、智算資源難以集聚、新型硬件融入受限等挑戰(zhàn)。多元算力的一體協(xié)同運用亟需屏蔽異構(gòu)硬件差異、融通智算豎井生態(tài),使能應(yīng)用一體部署和跨架構(gòu)遷移能力。
中國移動充分發(fā)揮算力網(wǎng)絡(luò)創(chuàng)新技術(shù)的積累優(yōu)勢,率先提出算力原生原創(chuàng)技術(shù),突破統(tǒng)一編程模型、跨架構(gòu)編譯、算力抽象、自適應(yīng)動態(tài)運行四大業(yè)界難題,形成以核心基礎(chǔ)軟件技術(shù)屏蔽底層差異,解耦緊耦合工具鏈建設(shè)模式的新方法,并積極在ITU、CCSA推動算力原生標(biāo)準(zhǔn)體系建設(shè)。
同時,中國移動充分發(fā)揮運營商的龍頭研發(fā)牽引作用,打破產(chǎn)業(yè)各自為戰(zhàn)的研發(fā)模式,建立協(xié)同橋梁,以算力原生技術(shù)為依托、典型應(yīng)用為牽引,研制發(fā)布芯合基礎(chǔ)軟件棧1.0,實現(xiàn)統(tǒng)一編程套件、源源轉(zhuǎn)換工具、跨架構(gòu)編譯器、自適應(yīng)運行時四大核心功能組件,完成3家硬件廠商3類算力硬件的適配,支撐圖像識別、視頻分析兩類應(yīng)用,在業(yè)內(nèi)首次實現(xiàn)智算應(yīng)用一次構(gòu)建、跨芯部署隨需遷移的目標(biāo),顯著降低AI應(yīng)用向多類異構(gòu)算力的遷移成本和復(fù)雜度,提升資源利用率及運營靈活性,有助于實現(xiàn)混合異構(gòu)算力集聚、一體協(xié)同運用的重要目標(biāo)。首個release版本已貢獻至OIF算力原生開源工作組,促進成果全球共享。
最后,解子巖表示,算力原生是多學(xué)科交叉技術(shù)領(lǐng)域,是需要產(chǎn)學(xué)研各界聯(lián)動的復(fù)雜系統(tǒng)工程,中國移動將進一步深化四大核心技術(shù)攻關(guān),開展已有成果的試用驗證。同時聯(lián)合產(chǎn)學(xué)研各界合作伙伴,以融通更多智算芯片、支撐更廣泛AI應(yīng)用場景為目標(biāo),全速打造芯合2.0,加快推動算力原生在以NICC新型智算基礎(chǔ)設(shè)施中成熟落地,培育開放融通的多元智算生態(tài)體系,打造算力發(fā)展新高峰,推動算力網(wǎng)絡(luò)實現(xiàn)全芯發(fā)展。