得益于國內軟硬件廠商協同發力,DeepSeek模型性能正在快速釋放。近日,澎峰科技正式宣布,公司自主研發的PerfXLM+推理框架已基于海光DCU,完成對DeepSeek全系列模型的深度適配與優化,進一步提升了AI大模型應用效能。
DCU深度協同,推動大模型降耗增效
PerfXLM+推理框架通過底層架構優化,全面適配海光DCU算力平臺,為DeepSeek模型提供了高性能支持。針對DeepSeek-R1-Distill系列等模型,框架結合海光DCU的并行計算能力,可顯著降低資源消耗,在同等硬件條件下進一步提升推理效率。
此外,海光DCU采用GPGPU通用加速計算架構設計,基于其高度兼容性與生態開放,DeepSeek模型可直接在海光DCU上運行,大幅減少底層適配工作量,技術團隊僅需聚焦模型精度驗證與持續性能優化,即可實現高效部署。
目前PerfXLM+推理框架通過模型量化、算子融合等核心技術,正在進一步挖掘海光DCU的異構計算潛力,為企業提供低成本、高穩定的AI推理服務。
核心場景覆蓋,滿足全行業AI需求
在信創與AI普惠化趨勢下,澎峰科技與海光DCU的深度結合,不僅打破了海外技術依賴,更以“框架+硬件+模型”的全棧能力,為全行業企業提供自主可控的AI基礎設施服務。
從應用層面來看,PerfXLM+推理框架現已覆蓋自然語言處理、多模態理解等核心場景,客戶可基于海光DCU集群實現模型快速迭代與彈性擴展,滿足各行各業的實時推理需求,推動AI技術走向規模化應用。
疊加海光DCU架構生態優勢和PerfXLM+推理框架的高效優化能力,企業AI部署門檻進一步降低,未來將加力賦能DeepSeek模型在產業終端的價值釋放,助力中國AI邁向全球產業鏈前沿。