8月30日,在中國移動第四屆科技周暨戰略性新興產業共創發展大會主論壇上,中國移動集團級首席科學家馮俊蘭博士代表中國移動面向業界正式發布了7個網絡智能化開放數據集。該數據集圍繞網元智能、運維智能、服務智能三大方向建設,是業界首個涵蓋無線信道、基站、云網、核心網、啞資源等多領域,支持感知、診斷、預測、決策等多類網絡AI能力研發的標志性數據集。本次發布,是中國移動積極落實網絡強國戰略、打造網信大國重器的重要舉措,為促進我國通信網絡與人工智能技術融合發展貢獻了重要創新資源。
通信網絡是數字經濟發展的基石,提升通信網絡的智能化水平,建設高度數字化、智能化的自智網絡是不僅是當前ICT產業技術創新的熱點方向,更關系到數字經濟的發展新動能。長期以來,通信行業缺少具備行業影響力、公信力的通信網絡公開數據集,尤其是有現網特色的真實、多樣的規模性數據,制約著網絡智能化關鍵技術的發展與突破,業界對高質量數據集需求迫切。
首批開放的數據集覆蓋多種場景
首批開放的7個網智精品數據集,來自于移動現網不同領域的生產創新需求,經過數據清洗及治理,總數據量達到上億,已經在中國移動一線維護、優化、服務保障等領域的生產實踐中經過了充分驗證,具有現網真實性、多樣性、數量多、種類全,覆蓋廣的特點,涵蓋網絡智能感知、預測、診斷、決策等多項能力場景,能夠為網絡智能化創新能力研發孵化提供數據基礎。數據集詳情如下:
CSI壓縮反饋:復雜信道環境的無線信道狀態信息數據及實測數據集,數據量級達到60萬條。該數據集可用于訓練CSI壓縮反饋等網元智能模型,壓縮UE側的信道特征信息,并實現信道狀態信息的無損還原, 實現快速準確的CSI壓縮反饋能力, 提升反饋精度、降低反饋開銷。
光網絡啞資源合規檢測:2萬張光交箱、通信桿、光纜等五類場景圖片數據集,該數據集可用于訓練網絡視覺模型,對傳輸線路中可能存在的啞資源進行檢測和識別,打造安全可靠、穩定運行的光纖傳輸網絡。
無線側故障根因分析:現網豐富的無線網絡運維告警數據和故障工單數據,涵蓋130類告警及23類故障原因,數據量級達到460萬條。該數據集可用于訓練故障根因分析模型,高效快速地定位故障問題,從而 減少實際派單數量,優化派單策略,節約人工成本。
無線鏈路質量預測:5G 多樣化業務應用場景下2萬條高精度時間分辨率下的無線網絡狀態參數及相應用戶業務下行速率信息數據,該數據集可用于訓練無線鏈路質量預測模型,預測用戶業務下行速率,實現無線鏈路狀態實時感知,提升用戶視頻業務體驗和無線網絡服務能力,達到網絡和業務協同的用戶體驗跨層智能優化。
無線小區多指標時空序列預測:無線通信場景下現網長時間(2個月)、大規模(萬量級)移動通信小區歷史序列數據,數據量級達到億條,涵蓋流量、用戶數等重要指標及多維度小區屬性信息,該數據集可用于訓練時空聯合序列預測模型,預測 多項小區性能指標的演變趨勢, 從而為網絡規劃和維護工作制定更精準智能的優化策略。
算網異常檢測及故障定位:算力網絡環境下網絡云化設備運行日志數據,包含154類異常標注,數據量級達到60萬 條。該數據集可用于建立有效的云網異常檢測模型和根因分析算法模型,實現快速準確的云設備故障檢測并定位故障原因,提升網絡運維效率。
網絡拓撲優化:面對現網環境拓撲負載不均衡的挑戰,現網10萬條網絡拓撲連接關系和網元屬性數據,該數據集可用于建立智能網絡優化模型 ,探索網元流量的變化規律,并據此對網絡拓撲結構進行動態優化,實現網絡負載均衡,提高網絡的性能和可靠性。
數據集的發布得到業界的高度認可
本次數據集的發布得到了中國移動各級領導和相關部門的大力支持。
中國移動集團公司副總工程師、集團級首席科學家王曉云表示:高質量數據是實現人工智能高質量發展的核心要素。中國移動傾力構建的這批網絡精品數據集,瞄準的是解決網絡智能化領域長期數據資源不足、技術創新路徑受限的產業難題。相信中國移動的貢獻,一定能夠為我國人工智能,特別是網絡智能化領域的技術研究、產品研發、人才培養、生態建設帶來全新動能。
中國移動集團公司技術部總經理陳洪濤表示:本次開放的7項網絡數據集,覆蓋了多領域的網元、運維、服務智能場景,具有很強的移動通信行業特色和應用價值,這也是中國移動建設智慧網絡國家新一代人工智能開放創新平臺的重要舉措之一,后續中國移動將持續發揮自身優勢,為產業開放更多的創新資源,更好的促進我國通信+AI技術的融合創新與突破。
中國移動研究院院長黃宇紅表示:中國移動構建的網絡數據集,既著眼當下又面向未來,不僅能夠助力現網運維優化等領域的人工智能算法創新,也能服務下一代網絡的前沿技術研究、方案驗證、模擬仿真和標準化等。中國移動期待能基于數據集的建設和不斷發展,與產學研各界勇闖網絡新技術無人區,共同構建我國信息通信技術新優勢!
中國移動集團級首席科學家,研究院人工智能與智慧運營中心總經理馮俊蘭表示:中國移動正在構建業界領先的網絡大模型,深刻感受到高質量數據的重要意義,也深知數據集的開放共享對于產業的巨大價值。我們希望以本次數據集的建設和發布為新的起點,能在網絡智能化技術創新方面匯聚更多的產業力量,攜手攻克智慧網絡的科學難題,共同實現通信網絡AI+X的發展新范式。
中國移動集團公司網絡事業部副總經理顧寧倫表示:中國移動充分發揮自智網絡子鏈的產業帶動作用,依托現網豐富多樣的數據優勢,挖掘網絡智能化痛點問題和生產需求,體系化構建多領域、大規模的移動網絡特色數據集。相信本次發布的數據集能夠有效助力網絡智能感知、診斷、預測、決策等領域的技術創新,助力我國自智網絡加快演進升級。
同時,業界專家對本次數據集的發布也給予了高度關注和充分肯定。
北京郵電大學理學院副院長、北京郵電大學-中國移動研究院聯合創新中心主任張建華教授表示:展望6G,將是通感算智深度融合的移動通信信息網絡。全面、海量、精確的通信網絡數據集,是6G技術研究和產業發展的亟需。我們期待并相信中國移動網智數據集的開放將為6G與 AI的深度融合技術創新提供寶貴的數據要素。北郵與中國移動研究院成立聯合創新中心以來,在6G信道測量平臺與數據集共建方面取得了豐碩成果,共同發布了面向6G AI空口的信道數據集。今后我們將繼續深化合作,持續建設發布優質數據集,服務產業發展需要。
新華三集團行業事業部副總裁、移動系統部總經理王棟良表示:在新一輪的產業變革中,人工智能正在釋放科技革命和產業革新的巨大能量。而數據,則是這股能量的關鍵源泉。自2021年開始,新華三便開始建設AI數據集,我們堅信,只有充分挖掘數據的潛力,才能推動算法不斷升級,加速產業突破。新華三積極支持移動研究院數據資源開放共享的建設,提供了大量AI數據集,充分挖掘數據集潛力,期待與大家攜手共同推動數據集的落地,助力數字產業發展變革。
未來,中國移動將依托智慧網絡國家新一代人工智能開放創新平臺,建設并開放更多優質網智數據集,為我國通信領域智能化技術突破、產業發展和通信+AI復合型人才的培養做出更大的貢獻。
開放網智數據集服務入口:
https://jiutian.10086.cn/open/#/setlist?platform=OpenInnovation