国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

阿里云彈性計算新升級:CPU上跑推理,模型起建成本降低50%|最前線

業界
TIME
2024-01-15 13:10
36氪
分享

  作者|武靜靜

  編輯|鄧詠儀

  1月11日,阿里云升級第八代企業級通用計算實例ECS g8i產品。新產品依托于英特爾在2023年12月發布的第五代至強可擴展處理器,以及阿里云自研的“飛天+CIPU”架構體系所搭建。

  升級之后,新產品的在算力、網絡、性能、應用場景方面有能力提升:

  • 算力層,ECS g8i實例的ECS g8i實例的L3緩存容量提升到320MB,內存速率提升至5600MT/s;
  • 性能方面,整機性能提升了85%,單核性能提升25%;
  • 網絡方面,PPS達3000萬,時延低至8微秒;
  • 場景上,新的ECS g8i實例可將MySQL數據庫的性能提升至60%,Redis和Nginx的性能分別提升40%和24%。

  面對目前火熱的大模型需求,新升級的ECS g8i實例進行了升級優化,讓大模型跑在CPU上,并有效降低了模型搭建成本。

  這對于大模型的商業化落地意味著全新的嘗試。一般而言,CPU在浮點、并行維度和內存寬帶上都與GPU能力相差甚遠,讓模型跑在CPU上是一件困難的事。

  在技術,ECS g8i上做了一次新的嘗試。為了解決首包延遲和吞吐性能技術難題,ECS g8i實例進行了針對性的技術優化,其內置指令集從AVX512升級到了Intel AMX高級矩陣擴展加速技術,可以加速模型運行。

  有了加速能力之后,模型推理過程在CPU上也能跑通,大大降低了大模型搭建和推理成本。此外,CPU相較GPU而言,更容易獲取,成本也更低,所以,這也為解決算力短缺難題打開了新可能。

  阿里云彈性計算產品線總經理張獻濤表示:“g8i可更迅速地響應中小規模參數模型,運行知識檢索、問答系統及摘要生成等AI工作負載時,起建成本相比A10 GPU云服務器下降50%。”

  阿里云新發布的ECS g8i產品

  目前,在CPU上,ECS g8i不僅能支持中小模型的推理計算,還可以支撐72B參數級別的大語言模型分布式推理。以阿里云通義千問開源的Qwen-72B大模型為例,它可在g8i實例eRDMA網絡構建的集群實現高效運行,輸入小于500字時,首包延時小于3秒,每秒可生成7個Token。

  此外,ECS g8i還能支持超過32batchsize的超大參數規模的AI模型負載,涵蓋目前市面上的文生圖、AI生成代碼、虛擬助手以及創意輔助工具等多類模型。

  在實際的模型落地中,要結合場景端的需求,綜合考量效果和成本。根據阿里云的測試,通過CPU做超高并發,可以充分利用算力,進行長時間計算和推理。目前,ECS g8i在一些對實時性要求不高的離線場景,比如創意廣告生成、離線視頻摘要生成等AI功能方面,已經有良好的效果。

THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時通知我們。

相關熱點

  最近這天氣暖得都讓大家忘了這是三九寒天了吧,看近10天氣溫距平實況圖,這顏色看著就喜慶↓  今天白天,黃河以南的大部地區氣溫繼續回升,最高氣溫20℃線北推到了河南...
互聯網
  1月14日,國家衛生健康委舉行新聞發布會,邀請相關專家介紹我國冬季呼吸道疾病防治和健康提示有關情況。  “今冬明春我國將繼續呈現多種呼吸道病原體交替或者共同流...
互聯網

相關推薦

1
3