大模型冷思考：智算產業應如何提升算效？

數碼

TIME

2024-04-03 15:25

通信世界全媒體

2024年，大模型應用迎來爆發期。類似于Sora這樣的AI應用每天都在給人們帶來新的思想沖擊。

據2023年的不完全統計，每隔一天在中國就有一個AI大模型出現，甚至實現了大模型的“日拋”，所以大模型得到了社會的全面關注。但是與最初的跑馬圈地階段不同，如今的大模型進入了深水期，躬身入局的參與者們，對算力的需求愈發復雜。

究竟要具備怎樣的能力，才能夠建設好AI時代的算力底座呢？也許從謀全局而非謀一域的角度考慮，才能真正地做好智算底座。

從賣鏟子1.0走向產業落地2.0時代

回看最初大模型跑馬圈地的階段，這一階段的大模型廠商第一要務就是購買更多更快更強的算力，也就是買更多的GPU服務器。而這些算力的提供商就像賣鏟子一樣，沒有過多地關注客戶應該如何去挖掘大模型的金礦，只需要更快更強的硬件產品就可以了。

但是2024年形勢就完全不一樣了。大模型從參數的競賽走向了商業化、產業化的落地階段，在這個階段不僅要提供算力的硬件，更多地是實現整個支撐能力體系的升級，就像“木桶原理”一樣，各類能力都不能有短板。

“在大模型狂歡的背后是對整個AI支撐能力加速迭代的提升，也就是說需要我們隨著客戶需求的變化把更好的產品技術和服務能力提供給客戶。”寧暢CEO秦曉寧近日講道。

“做算力可太難了，每個月月初都在發愁算力成本。”北京電子數智科技有限責任公司首席戰略官楊震先生指出，如今的算力成本非常高，這也成為制約整個人工智能產業向前發展的因素。對于大模型廠商而言，千億級、萬億級的參數量級，下一步可能是十萬億級GPT5，級別越大需要的算力越大，就需要瘋狂的增加硬件成本。

算力可以靠堆硬件，但是算效問題就不行了。訓練通用大模型的客戶本身是有很強的算法能力，但是很難提升算效。即使如OpenAI在GPT4訓練過程當中的算力的利用率也就大約為35%，這種算力利用率低的情況在業內是非常普遍的。

具體到行業而言，據統計，金融行業AI大模型的應用滲透率是最高的，而建筑行業雖然應用成熟度高但是AI大模型的滲透率很低。所以今年大模型離行業產業越來越近的時刻面臨的挑戰和需求愈發復雜和多樣化，需要在算力、算法、數據三個維度來提供更需要更強的支撐。而且在AI的硬件層、集群層、中臺層、內容層、服務層都需要全方位多維度支撐能力的提升。

在大模型百花齊放的背后，是不同發展階段的客戶涌現出來的對于AI支撐能力體系愈發復雜的需求，不管是萬卡時代的算效彩票還是深入行業的精度盲盒，以及高效調用的服務瓶頸，如何解決這些問題，如何面對這些問題，如何滿足客戶不同的復雜需求，從而建立起一套全面的AI的支撐能力體系，是當下急需解決的問題。

“只有在算、網、存、管四個方面全面地能力的提升，才能夠形成極致的算效體系，從而提升客戶在算力的訓練當中的利用率。”秦曉寧認為。

為此，寧暢推出“全局智算”戰略。“全局智算”顧名思義就是以系統的全面性來對抗需求的復雜性，寧暢將以全面AI支撐能力覆蓋大模型發展的全生命周期的需求，從而解決客戶復雜的系統性的大模型的落地的問題。

秦曉寧解釋道：“寧暢的‘全局智算’具備六大‘全’特性，涵蓋軟硬件全體系及全液冷產品，提供從咨詢到運維的全流程服務，滿足全行業用戶大模型開發、適配、部署的全場景需求，并按用戶發展階段，定制專業且性價比高的AI計算方案。”

這六個“全”分別是全體系、全液冷、全服務、全場景、全行業、全階段。寧暢不僅提供軟硬件兼備的全體系以及業界領先的液冷的全產品家族，還可以提供咨詢、測試、運維、售后的全服務場景，滿足客戶從大模型的開發、適配、部署、全場景需求，并且根據客戶發展不同階段，提供寧暢定制化服務。

“這六個‘全’特點的能力矩陣，向上能解決極致算效、精度增強、高效穩定三個復雜的客戶問題，向下可以賦能千行百業，讓大模型落地成為各行各業的新質生產力。”寧暢CTO趙雷解釋道。

全新算力棧一站式解決智算難題

與此同時，為了有效解決大模型產業落地的全周期問題寧暢還推出了“AI算力棧”。

“AI算力棧”集成了寧暢在AI計算領域的軟硬件能力，以底層硬件到頂層應用平臺的系統化方案，滿足大模型落地所需的計算、存儲、網絡、建設、管理、應用及液冷等全方位需求，以其全面、靈活、深度的支撐能力，為行業級/企業級智算中心的構建提供了強有力的支持。

全局智算能力映射在AI算力棧上，體現的是深厚的技術硬實力和豐富的軟實力。

寧暢CTO趙雷表示，在硬件層上，算力棧可實現多種交付形態靈活組合。其中，寧暢B8000液冷整機柜服務器作為AI算力棧最具亮點的交付形態，采用電、液、網三路全盲插設計，部署周期相較傳統方式提升30倍。

在軟件層上，算力棧基于系統工程及算法模型，以AI算子全棧優化能力，為AI業務提供并行加速、性能分析、模型開發優化等服務支持，構建出從算力資源定制，到模型適配優化，再到高效部署落地的大模型算力服務閉環，幫助用戶極速推進AI應用開發及管理。

在桐鄉，國內首個AI算力棧——NEX AI Lab（Nettrix AI Open Lab）已成功落地。NEX AI Lab集成加速計算節點、全閃存存儲節點，可為GPT、LLaMA、Stable Diffusion等AI模型，提供多元場景應用優化支持。目前，NEX AI Lab已開放預約試用，以支持用戶體驗大模型、數據科學、推薦系統等領域的解決方案工作流。

據了解，NEX Al Lab主要以X640 G50組成，采用400G 網絡，同時還支持20個節點的X680 G55 的液冷服務器，有效驗證液冷服務器在高帶寬情況下的使用情況，同時搭配了做checkpoint用的全閃存儲節點，可以給用戶提供免費的算力體驗。企業可以把自己的業務拿到上面運行，嘗試不同的業務組合，嘗試不同的網絡方案，嘗試不同的軟件和框架的調整，以便快速做出購買決策。

“其中，X680 G55 服務器是液冷的，采用800G 帶寬互聯的 GPU 服務器。在整個算力中心我們已經完成了大量的多元的AI場景的實際應用，包括語言模型、OCR的、翻譯、智能推薦我們都做了初步的測試，實際證明各種各樣的應用還是能夠有效地運行的，已經運行了快三周時間了。”趙雷介紹道。

作為此次智算戰略的重要合作伙伴，英特爾也與寧暢通力合作推出了高密度的多節點服務器B5000，能夠更好地滿足現在AI工作負載的需求。搭載了4U8節點結構，而且可以搭載第四代/第五代英特爾? 至強? 可擴展處理器，具有更多的計算核心，更大的算力，而且有更靈活的能力，它所提供的高密度部署而且強大的計算能力非常好地滿足了用戶工作業務的多樣性和靈活性的需求。

英特爾AI首席架構師吳震華指出，大模型的部署和推理的環境到目前為止GPU會成為新的算力的推薦引擎，但是在目前CPU仍然具有一個通用性好，算力普遍的優勢，而且CPU同時具有易于部署的特性，到目前為止65%以上的推理任務仍然運行在處理器上。CPU算力對于AI無處不在的愿景而言依然是重要的推動能力和手段。據了解，B5000服務器相對于GPU服務器不僅有巨大的算力，而且提供了巨大的內存，一個實例可以承擔更多的并發的服務請求。

如今，寧暢NEX AI Lab已開放預約試用，用以展現應用場景優化、行業智算定制解決方案，通過免費提供軟、硬件服務，帶來大模型、數據科學、推薦系統等解決方案工作流的先進體驗。未來，“AI算力棧”方案將進一步落地汽車、互聯網、制造、金融、能源、科研等領域，成為推動數字化轉型、實現智能化升級的核心引擎。

THE END

免責聲明：本文系轉載，版權歸原作者所有；刊載之目的為傳播更多信息，如內容不適請及時通知我們。

国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

大模型冷思考：智算產業應如何提升算效？

相關熱點

最新文章

相關推薦

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復消息，背后原因挺“傷人”

關注我們

国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

大模型冷思考：智算產業應如何提升算效？

相關熱點

最新文章

相關推薦

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙 航天員劉伯明成功開啟天和核心艙節點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復消息，背后原因挺“傷人”

關注我們

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節點艙出艙艙門