DeepSeek-V3 和 R1 只是趨勢發展的一部分
DeepSeek-V3(和R1)的到來猶如晴天霹靂,令業界和市場措手不及,導致DeepSeek 被稱為市場顛覆者;但事實上,AI行業在過去幾年中一直在逐漸改變。DeepSeek-V3只是體現了一直在發生的變化:從大型專有、通用模型向小型、特定任務、開源模型的過渡與轉變。
更具體地說,QLoRA(量化低秩適配器)、快進低秩訓練、模型合并和蒸餾等一系列新技術推動了開發更小、計算效率更高的模型。然而,將這類發展全部歸功于一家公司或是單一市場是錯誤的。好多企業都在推進這方面的技術。谷歌和微軟一直非常活躍,其項目包括 Gemini 2.0 Flash Thinking和Phi-4,而基礎性的 Llama 系列則源自 Meta。
小型模型在邊緣設備中尤為重要
小型模型尤其有利于邊緣設備(如智能手機、個人電腦、機器人和大量物聯網設備)的創新。在邊緣環境中,計算資源往往是有限的,與依賴云的大型模型不同,DeepSeek-V3可以在本地托管,這對優先考慮數據隱私的組織和專注于需要超低延遲的邊緣人工智能應用的廠商來說很有吸引力。
為了將通常規模龐大、資源密集的基礎模型無縫集成到計算和存儲資源有限的環境中,必須對基礎模型進行優化。通常情況下,開發人員會采用三種常見的模型壓縮方法,即剪枝、蒸餾和量化。DeepSeek 已經證明,采用正確的技術可以壓縮基礎模型,使其嵌入邊緣設備。
異構計算和 “NPU ”的發展
物聯網是種分散式、去中心化的科技,所以需要各種能力的配合,其中一些能力只需要較低的計算處理和數據傳輸。相比之下,另一些則需要在網絡邊緣運行人工智能模型的能力,以便實時處理數據并采取行動。雖然云計算的集中性在成本效益、資源效率、靈活性和便利性方面具有優勢,但它也有顯著的缺點。來自端點或網絡邊緣設備的數據必須依靠網絡從原點去到集中式數據中心(即云計算)進行處理和存儲,然后再返回給用戶。
雖然這可能適用于一系列傳統應用,但越來越多的用例需要在網絡延遲最小的情況下進行實時決策,因此在終端和云之間傳輸信息的時延要求也越來越高。
如圖 1 所示,半導體供應商正在通過開發一系列處理器來滿足這些異構計算需求,這些處理器可以處理物聯網多重要求所需的各種計算需求。這些發展的核心是神經處理單元(NPU),它是為以低功耗加速人工智能推理而設計的,并隨著新的人工智能用例、模型和要求的發展持續演進。Omdia 預計,具備人工智能能力的邊緣處理器和架構將繼續發展,有效解決網絡邊緣的人工智能推理問題。
圖 1:高通展示了NPU 隨著不斷變化的人工智能用例和模型而發展,以實現低功耗下的高性能
Source: 高通
DeepSeek 能否加速 AIoT 的發展?
如圖 2 所示,物聯網部署日趨成熟,企業越來越希望從海量數據中獲得洞察力,結合分析、AI/ML 和邊緣處理來實時洞察運營環境,并在未來提高許多流程的自動化水平(例如,制造業中的預測性維護、智能城市中的本地化交通管理系統或 RPM 醫療設備中的心率異常檢測)。
在運行環境中,將更多處理能力和決策制定推向邊緣的好處顯而易見:
實時處理 - 通過本地處理數據,設備可以即時做出決策,而無需等待服務器的響應。這對于交通系統、制造環境或醫療保健等要求實時響應的環境至關重要。
數據隱私 - 在 OT(操作技術)和 IT(信息技術)系統之間分割或隔離數據的能力至關重要,尤其是在涉及電網等關鍵基礎設施時。離線或脫鉤運行人工智能和智能語言的能力為改善運行環境和降低與聯網系統相關的風險提供了重要機會。
網絡效率 - 通過本地數據處理,傳輸成本大大降低,從而降低了采用和實施的門檻。
圖 2:哪些服務是您的物聯網部署戰略的一部分?
那么,DeepSeek如何應對其中的一些挑戰,并幫助推進AIoT的實施呢?
本地化人工智能模型。DeepSeek R1的提煉方法展示了如何壓縮復雜的人工智能能力,以便在邊緣部署。最小的模型可以在基本硬件上運行,同時保留核心功能。
分布式學習。這使邊緣設備能夠改進其人工智能模型,同時保持數據的私密性,這對于敏感或關鍵的操作環境尤為重要。
專用硬件。專用處理器正在不斷發展,以更好地支持邊緣的人工智能工作負載,從而使部署 DeepSeek-R1 等模型更加實用。隨著物聯網部署日趨成熟,企業希望進行更全面的規劃,并預測可能要部署的未來用例。
當然,仍有一些障礙需要克服,因為即使是精簡模型也需要大量計算能力才能運行。此外,精簡模型可能會影響復雜的推理任務:為點解決方案定義模型,可能會在物聯網環境的漫長生命周期中導致實施方案過時。物聯網是高度分布式的,這意味著本地模型的協調可能只適用于特定的運行環境。
盡管如此,DeepSeek 所展示的技術進步為更多云-邊緣混合部署打開了大門,使智能能夠在 “微邊緣 ”更接近數據。摩爾定律表明,更強大的專用硬件將繼續向邊緣擴散,這將在未來幾年繼續推動人工智能物聯網的發展。