国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

生物計算領域,為什么超算安騰比通用超級計算機算得還要快?

熱點
TIME
2024-04-09 17:21
搜狐網
分享

  一直以來,超級計算機因其無可匹敵的運算實力而在科研界享有“巨擘”之稱,大眾耳熟能詳的莫過于那些榮登全球超算Top500排行榜的翹楚品牌,如Frontier和神威·太湖之光等,它們展現出了卓越的通用高性能計算能力。然而,在生物計算這一細分領域中,即便是這些巨頭也會顯得有些“力不從心”,難以全面應對諸如大規模分子動力學模擬、蛋白質三維結構預測等極具挑戰性的任務。這時,就不得不提在生物計算領域占據顯著地位的專用超級計算機安騰(Anton)了。

  安騰超級計算機   圖片來源:D.E. Shaw Research

  安騰超級計算機是由美國D. E. Shaw研究所于2007年首次發布,專門用于對生命科學研究和生物制藥研發領域至關重要的算法——分子動力學模擬算法的加速。在計算分子動力學模擬(Molecular Dynamics, 簡稱MD)問題時,超算安騰的計算效率比全球最強的超算Frontier還要高上數十倍。

  為什么安騰超級計算機能比美國Frontier算得還要快?

  秘訣就在于安騰超級計算機的“專項定制”屬性。安騰超級計算機由大量的特定應用集成電路(ASIC)組成,通過一個專門的高速三維環形網絡相互連接 。不同于通用超算的一刀切設計,超算安騰的架構專為細粒度事件驅動而設計運算,通過增加計算與通信的重疊來提高性能。

  由于安騰超級計算機主要專注于分子動力學模擬加速,即其所應對的主要任務屬于通訊密集型的并行計算范疇。在此背景下,超算安騰在芯片設計、通信網絡這兩個方面進行了特殊設計,從而有效提升此類任務的計算效率。

  512個深度定制ASIC芯片 提供強大算力支持

  首先,在硬件層面,由于CPU、GPU等通用的算力芯片無法滿足特定問題對算力性能的要求,因此,專用超級計算機常常選擇搭載ASIC芯片(即專用集成電路),以針對性地提供解決特定問題所需的強大算力支持。

  安騰超級計算機的核心優勢就在于其使用的512個MD專用ASIC芯片。這些芯片經過深度定制,具有針對性強的指令集架構(ISA),能夠精確執行分子動力學模擬(MD)中最耗時和最頻繁的計算任務,如分子間的長程和短程相互作用力的計算,為這些關鍵計算步驟提供硬件算法層面的性能優化,例如快速傅里葉變換(FFT)等算法。

圖片來源:D.E. Shaw Research

  同時,為了減少計算延遲,安騰超級計算機還設計高度專業化的專用硬件數據路徑和控制邏輯,用于評估范圍受限的相互作用,并執行電荷擴散與力插值。除了在芯片上密集整合高度定制化的計算邏輯之外,這些流水線還針對每個操作都采用了定制化精度。

  “量體裁衣般的并行計算硬件設計  只為提升計算性能

  GPU、通用超算等通用的計算架構更多關注的是訪存密集型任務的優化,而超算安騰則是針對通訊密集型的并行計算問題進行了特化優化。因此超算安騰在處理高度依賴大量通訊密集型并行計算的分子動力學計算任務時,自然就會比傳統的通用超級計算機架構多出許多天然的優勢。

  具體來說,超算安騰上運算的分子動力學算法的主要應用領域之一是對蛋白質進行的仿真模擬。這類仿真模擬任務需要計算機記錄當前每個原子的位置、運動狀態等,之后利用分子動力學模擬計算這些粒子之間相互影響的運算結果。在這樣的情況下,每個節點需要承擔的運算并不復雜,所以并不需要每個計算單元具有極其高強的計算能力;也不需要大規模數據的輸入輸出存,所以也不是訪存密集型任務。因此在設計上,安騰超級計算機取消了其它并行計算硬件中十分常見的緩存,也就是不需要很大的存儲空間。

  例如,對于一個包含25,000個粒子的MD模擬,其整體架構狀態只需要1.6兆字節,放到一個由512個節點構成的系統中,每個節點僅占用3.2千字節。鑒于此特性,超算安騰選擇在ASIC上僅僅配備SRAM和小型L1緩存,并確保在常規操作條件下,所有的代碼和數據都能夠妥帖地裝載在芯片之上,沒有把寶貴的硅片面積用于構建大型緩存或是復雜的內存層級結構,而是將這些資源重點投入到通信和計算性能的提升上。

  此外,分子動力學模擬中,最為消耗計算資源的是分子間的長程相互作用力的計算,如靜電相互作用等。據統計,在通用處理器上運行的標準MD模擬中,計算靜電和范德華力所耗費的時間占到了總體計算時間的約90%。由于這些力的計算都是基于成熟的物理原理和公式得出的,不太可能隨力場模型進化而發生巨大改變,基本因此非常適合硬件加速。但是,要想實現MD模擬的顯著提速,光是加速這些“核心循環”還不夠,還需要對其他相關的計算任務進行同步加速。依據阿姆達爾定律,即使把前述占用90%計算時間的任務的計算效率大幅優化,如果其余10%的計算任務還是維持現狀的話,整個系統的最大加速比也只能達到10倍左右的上限。因此,超算安騰特意劃撥了相當一部分硅片面積用于加速那些諸如鍵力計算、約束條件計算、速度和位置更新等其他關鍵任務。

  服務器擺放與網絡結構的特殊設計 有效提升通訊效率

  在通信層面,由于分子動力學模擬是一種需要大規模并行化的計算密集型方法,因此快速并行分子動力學模擬的實現就需要節點間通信的高帶寬和低延遲。為提高通訊效率,安騰超級計算機也做了一些特別的設計。

  例如,整個超算安騰的服務器都被緊密地擺放在一個正方體的機箱中,這樣的好處在于節點之間依靠網絡互聯,緊密排列使得網絡的傳輸距離大大降低,可靠性和速度大大提升,所以速度有了很大的提升。

  又比如,超算安騰設計了獨特的內存子系統,專門用于積累每個粒子所受的力,這樣可以減少計算過程中必要的數據交換。為了進一步提高計算效率,安騰超級計算機采用了低延遲、高帶寬的網絡結構,不僅在單個ASIC芯片內部實現了快速通信,還在不同ASIC芯片之間也建立起了高效的互聯網絡。這個網絡特別支持常見的MD通信模式,比如多播和稀疏數據結構的壓縮傳輸,同時也支持協調式的“推送”式通信方式,即生產者主動將結果發送給消費者,無需消費者預先請求數據。此外,系統中還配備了一系列獨立的直接內存訪問(DMA)引擎,用于卸載計算單元的通信任務,使得通信和計算過程能更緊密地重疊執行,從而最大程度減少等待時間。

ASIC芯片通過高速通道直接連接,形成三維環形拓撲結構

  圖片來源:D.E. Shaw Research

  通過以上分析可見,安騰超級計算機通過一系列精密的硬件和軟件協同設計,聚焦于加速分子動力學模擬的關鍵環節,使得其在處理大規模生物分子系統長達百微秒級別的經典分子動力學模擬時表現出前所未有的高效性。

  安騰超級計算機的技術路線無疑為我國超算領域、尤其是專用超算領域的技術研發提供了路線借鑒參考。在生物制藥、生命科學、新能源新材料等前沿科技火熱發展的重點垂直領域,我們應當加強全棧式的軟硬件協同創新,挖掘在特定計算難題上的重大產業和創新機會,不斷提升在全球超算競賽中的競爭力與影響力。


THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時通知我們。

相關熱點

  近日,據媒體報道,浙江杭州的江先生遭遇了一件煩心事。出于對淘寶平臺的信任,他在該平臺上購買了七瓶承諾保真的茅臺酒,準備用于重要的商務場合。然而,在收貨后經專業鑒...
互聯網
  之前買的藥品、保健品過期了怎么辦?先別著急扔,可以免費換個新的!  在“京東買藥8周年”之際,京東買藥重磅推出“過期免費換”服務。  該服務覆蓋了藥品、保健品、...
互聯網

相關推薦

1
3