C114訊 1月21日消息(邵鵬慧)近年來,AI技術發展呈爆發式增長趨勢,特別是AI 大模型的亮相,引發了全球范圍的應用熱潮,不少業內專家將2024年視為AI應用落地元年。以AIGC為代表的新應用、新需求崛起,推動智能算力規??焖僭鲩L,與此同時,算力緊缺、功耗飛漲等問題逐漸顯現。在這樣的背景下,建設高效、靈活、綠色智算中心成為滿足 AI 算力需求的必然選擇。
數據中心歷經計算中心、信息中心、云數據中心,現已邁入算力中心時代。早在十幾年前,浪潮信息便開始預制化集裝箱數據中心領域建設布局,經過多年技術積累,浪潮信息采用預制化AIDC解決方案的元腦算力工廠正式投運,僅用120天時間由119個集裝箱拼接搭建而成。
近日,C114走進浪潮信息元腦算力工廠,切身體會預制化AIDC解決方案的落地實踐,極其承載的大模型開發應用等多業務場景。
預制化AIDC展現顯著優勢
據了解,傳統數據中心建設周期長,需經過設計、土建、機電安裝、調試等多個階段,規劃及建設周期通常在3年以上,跟不上高速增長的AI算力節奏,難以滿足各行業對算力快速迭代和高速增長的迫切需求。
同時,面對國家 3060 政策下的能耗挑戰、東數西算的布局考量以及散熱技術的革新需求,數據中心節能降耗勢在必行。此外,傳統數據中心還面臨擴容難的挑戰,無法第一時間跟隨技術迭代和業務發展需求完成升級調整,可能面臨建成即落后、供不應求的窘境,投資回報率難以保障。在此背景下,預制化AIDC解決方案應運而生。
在接受C114采訪時,浪潮信息服務器產品部產品行銷處經理周相峰表示,預制化AIDC具備快速交付、高效節能、靈活擴展等核心優勢,可滿足新型數據中心快速上線、綠色低碳、靈活部署的剛性需求。
周相峰介紹,與傳統數據中心相比,預制化AIDC采用預制集裝箱模塊化設計,以搭積木的方式進行搭建,與土建解耦,不受現場條件限制,工期可縮短80%左右,實現快速交付。預制裝配率可達90%,實現4個月建成,17天交裝完畢,解決了傳統數據中心建設周期長、無法滿足業務快速上線的問題。
在綠色低碳方面,浪潮信息創新將液冷、光伏、儲能、余熱回收等多種綠色技術有機結合,提高散熱及能源利用效率,實現綠色節能,PUE可降至1.1以下,降低碳排放25%,4個集裝箱(千卡規模算力)每年可節省電費 400 萬元。
在靈活性方面,可實現彈性擴容,預制化AIDC初期根據資金水平和算力需求按需部署,后期可根據算力設備升級擴容。在支持水平擴容的同時,可實現豎向按需擴容,最高可擴容至5層,實現全場景覆蓋。此外,IT、電力、集成冷站、液冷冷源、辦公、走廊、電梯、樓梯等八種功能箱體,可根據不同場景、規模靈活組合,并按照功率區段分區部署,實現風冷/液冷、AI/通用/高密度等多種形態靈活兼容,匹配智算算力、通用算力、邊緣算力等多種應用場景。
挑戰與機遇并存
未來,預制化 AIDC 將憑借其快速交付、綠色低碳、高密部署等優勢,成為智算中心建設的主流趨勢。但是浪潮信息預制化AIDC解決方案發布的成長之路并非是一帆風順的。
在浪潮信息服務器產品線副總經理李金波看來,選擇集裝箱的建設模式建設大規模智算中心,是一個擺在浪潮信息面前的現實難題。規劃階段需確保其具備靈活擴展能力,實現上層擴建時下層正常運行;建設過程中如何高效完成集裝箱的拼接、互聯、確保設備正常運行以及對于新技術的融合與創新,都需要不斷摸索。
李金波表示,針對以上難題,浪潮信息技術團隊深入研究,對集裝箱結構進行優化設計,確保大規模拼接時的穩定性和功能性。由單箱到超大集群,在箱體設計中采用四柱八梁結構,增強梁的承重能力,合理規劃箱板厚度與保溫性能,充分考慮上層施工時下層的正常使用,能從各方面滿足智算中心使用需求。
此外,對關鍵技術持續攻關,例如,在供配電方面,研發簡電路供電技術,提升供電效率;在算力節點大量使用高密智算算力倉,浪潮信息風冷和液冷智算算力倉在全國應用密度較高,現能做到50kW的風冷、130kW的液冷。
經過在困境之中的不斷探索,如今,浪潮信息預制化 AIDC方案已從內到外具備自身獨特優勢,在互聯網、金融、能源、教科研、汽車等行業均有落地應用。
算力工廠賦能AI應用落地
算力是集數據傳輸、計算、存儲于一體的新型生產力,更是培育新質生產力,推動智能化轉型的核心驅動力。
大模型如何進一步發展,就是應用落地。浪潮信息人工智能與高性能產品部副總經理張強說道。如今,浪潮信息元腦算力工廠包含了數據處理、AI大模型、業務應用、研發測試等多個集群,為全球服務器壓力測試、大模型開發應用、智能化轉型等業務應用提供算力支撐。
張強指出,在推動大模型落地應用領域,針對網絡通信效率瓶頸,元腦算力工廠采用 X400 超級 AI 以太網方案,為大模型訓練提效降本,提升了大規模GPU訓練性能,成為新型AI訓練網絡解決方案。其吞吐量51.2T為業界最高,較前代提升4倍,相比傳統RoCE網絡性能提升1.6倍,通信時延降低30%,能大幅提升大模型訓練效率,縮短訓練時長并降低訓練成本。
元腦算力工廠搭載企業大模型開發平臺元腦企智EPAI,連接多元算力、多元模型與應用層,實現模型高效微調與跨平臺無感遷移,加速大模型在各個行業落地應用。同時,元腦算力工廠助力企業智能化轉型,智能編程助手、智能投標助手、智能客服、供應鏈大腦、智能工廠等系列智能創新成果相繼落地,賦能業務智能化轉型。
在提升大模型訓練效率方面,張強向C114介紹,元腦算力工廠通過算力開發平臺 AIStation 對算力進行有效調度。在實際算力使用中,AI應用有不同算力需求,在這多用戶、多任務場景下,對算力需求不同,AIStation能對算力集群進行有效調度,降低成本、提高算力利用率,保障算力集群安全、可靠運行,實現智能、高效、低成本運維。
據IDC數據顯示,受AI影響,從2022年到2026年,中國區人工智能算力規模年復合增長率將達到52.3%,算力需求將迎來更爆發式增長。元腦算力工廠成為浪潮信息智能化轉型重要節點,未來浪潮信息將依托預制化 AIDC 方案等智算創新,賦能千行百業,助力企業實現綠色、高效、智能轉型升級。