国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

DeepSeek公司發布專為英偉達Hopper GPU打造的大模型加速器FlashMLA

數碼
TIME
2025-02-26 11:18
通信世界全媒體
分享

近日,DeepSeek公司正式發布并開源其最新技術成果FlashMLA。FlashMLA是專為英偉達Hopper架構GPU打造的高效多層注意力(Multi-Layer Attention)解碼內核,并特別針對變長序列場景進行了優化,可顯著提升大模型推理性能。同時,FlashMLA通過對BF16精度的全面支持,以及采用塊大小為64的頁式鍵值緩存系統,實現了更精確的內存管理。

在性能表現方面,基于CUDA12.6平臺,FlashMLA在H800SXM5GPU上表現突出:在內存受限場景下達到3000GB/s的處理速度,在計算受限場景下則實現580TFLOPS的算力水平。

THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時通知我們。

相關熱點

  近期,由上海人工智能實驗室、上海交通大學等機構共同發布了一項創新算法技術,該技術能夠使人形機器人從各種狀態下實現快速、穩定地站立。據上海人工智能實驗室青年...
智能AI
  日前,我國科學家開發了一種名為“石蠟輔助浸入法”的新技術,成功讓二維材料“卷起來”,制備出具有可控手性的石墨烯卷,為未來量子計算和自旋電子器件的發展奠定了堅實...
業界

相關推薦

1
3