1897年,作家馬克·吐溫在讀到自己訃告時調侃道:“關于我的死亡報道,被嚴重夸大了?!蓖瑯?,在數據存儲行業,機械硬盤多年來也經歷著諸如江河日下等被夸大的報道。
然而,就像這位“被死亡”但此后健在多年且頗為高產的作家馬克·吐溫一樣,機械硬盤也同樣得到長足發展,存儲了超大規模云數據中心近90%的數據,而世界上絕大多數EB級數據都存儲于這些數據中心。隨著云和人工智能生成的數據量急劇增加,對大容量存儲的需求之大前所未有。
當然,存儲需求的提升并非什么新鮮事。新鮮的是需要存儲的數據飛速增長。市場研究機構IDC預測,2027年,全球產生的數據量將達到291ZB,而在2023年,該數據為129ZB,相當于2022-2027年復合年增長率為22.4%(來源,IDC全球數據圈預測,2023-2027年,#US50554523,2023年4月)。
據Statista稱,從2010年到2022年,全球創建、存儲、復制和消費的數據量增加了60倍,并且這一速度還將繼續加快。
推動這一趨勢的是生成式人工智能和大語言模型的部署。由于需要大量數據來訓練和優化,最好的人工智能模型在很大程度上依賴于大容量數據存儲。領先的公司將越來越希望保留其原始數據集和人工智能處理的結果。
以特斯拉為例,特斯拉從世界各地道路上的數百萬輛電動汽車收集大量數據,用于訓練人工智能駕駛模型和地圖繪制。
社交媒體是另一個例子:Facebook、LinkedIn、小紅書和YouTube等平臺收集大量數據,用人工智能進行分析。2023年,6798億美元的全球廣告收益證明了該商業模式的成功。
世界經濟論壇在一項調查中表示,75%的受訪公司預計在未來五年內采用人工智能技術來增強其產品和服務并提高生產力(來源:世界經濟論壇,2023年5月)。
總之,我們預計ChatGPT、文心一言(Ernie Bot)和Bard等生成式人工智能技術將在未來五年內創建100ZB的數據。
存儲所有數據
為了應對數據增長,需要更多的存儲容量,這就進一步需要更多的物理數據中心來容納面密度和容量更高的存儲設施。
大多數通信服務提供商和數據中心運營商都會混合采用機械硬盤和固態硬盤。他們設計的存儲架構由精心優化的存儲介質組合而成,考慮了支持的工作負載的成本、容量和性能要求。
隨著數據量的飆升,對機械硬盤和固態硬盤的需求將繼續居高,機械硬盤服務大容量工作負載,同時,固態硬盤解決具有更高性能要求的工作負載。
數據的指數級增長將成為促進大容量機械硬盤需求的關鍵驅動力,機械硬盤與閃存的協同作用將繼續支持現代工作負載。
硬盤繼續扮演關鍵角色
為了應對所預測的數據存儲增長,硬盤必須在存儲容量方面做得更好,這意味著硬盤的面密度需要大幅增加。幸運的是,硬盤行業一直在努力解決這個問題,引入了新的技術,如熱輔助磁記錄(HAMR),可以成倍地擴展碟片密度。希捷第一代HAMR硬盤每個碟片容量為3TB,相比之下,傳統PMR硬盤單碟片最高容量為2.4TB。預計未來幾代HAMR硬盤將進一步將面密度提高到單碟片容量4TB或5TB。這相當于在不久的將來,我們將擁有40TB-50TB的大容量硬盤。
硬盤外形規格不變的情況下增加容量,這有利于數據中心輕松地在現有硬盤壽命結束時進行更換,以最低的成本擴展整個數據中心的存儲容量,且幾乎不會造成業務中斷。在多PB和EB規模上,將16TB的傳統PMR硬盤替換為30TB的HAMR硬盤可以顯著節省功耗和其他運營成本。
事實上,由于數據中心對耗電量和國家發電能力的影響,世界上許多國家都暫停了數據中心的部署。硬盤面密度的創新是許多數據中心運營商在有限資源下管理數據激增問題的一個強有力解決方案。
規模上的可持續性
從規模上看,面密度創新使企業能夠在現有空間中找到更多空間。HAMR技術可以極大地增加數據中心的容量,而無需增加數據中心的占地面積和成本。
一般來說,面密度等于更環保的數據中心和更可持續的存儲。提高能源效率可減少數據中心對環境的影響和運營成本,同時從長遠來看,可以提高性能。同一數據中心占地面積內的數據越多,意味著有功功率(每TB瓦數)的大幅降低;它幫助企業可持續運營并實現其碳減排目標。
結論
在人工智能的浪潮風靡全球時,當前行業的目光主要聚焦在人工智能的顛覆性潛力、對人工智能處理器和計算引擎不斷增長的需求、以及對云存儲容量的需求。然而,這往往忽略了云存儲實則依賴于硬盤而存在的事實。為了充分發揮人工智能的潛力,我們需要通過增加面密度來大幅增加硬盤的容量。隨著希捷開始批量生產HAMR硬盤,硬盤行業已做好準備去應對這一挑戰。