一、 有線寬帶運(yùn)維面臨的問題
中國移動(dòng)用戶規(guī)模巨大但仍在持續(xù)增長,截至到2023年6月份,中國移動(dòng)有線寬帶用戶累計(jì)達(dá)到2.86億戶。伴隨用戶快速增長,有線寬帶的光纖公里數(shù)、網(wǎng)元數(shù)量、網(wǎng)絡(luò)拓?fù)浼斑B接復(fù)雜度大幅增加,同時(shí)隨著互聯(lián)網(wǎng)新業(yè)務(wù)的不斷出現(xiàn),網(wǎng)絡(luò)運(yùn)維面臨諸多重大挑戰(zhàn)。
第一,有線寬帶網(wǎng)元層級(jí)多、無源光線路長、最后1公里不可控因素多;有線寬帶跨多個(gè)網(wǎng)絡(luò)域(涉及家庭網(wǎng)絡(luò)、接入網(wǎng)、城域網(wǎng)、骨干網(wǎng)、省網(wǎng)、傳輸網(wǎng)、業(yè)務(wù)平臺(tái)/內(nèi)容分發(fā)網(wǎng)等。如圖1所示)、管理線條多,流程有時(shí)依靠人工流轉(zhuǎn);網(wǎng)元廠家多,未開放標(biāo)準(zhǔn)化的操作接口,很多管理配置還依賴于手工操作。以上導(dǎo)致出現(xiàn)網(wǎng)絡(luò)質(zhì)差時(shí),難以自動(dòng)提前或及時(shí)發(fā)現(xiàn)問題;發(fā)生故障時(shí),缺乏端到端整體分析,需要較多人工處理,排查定位和修復(fù)故障的效率低耗費(fèi)時(shí)間長;被動(dòng)等待投訴后處理,仍存在大量潛在質(zhì)差用戶未得到處理。另外,有線寬帶還較易受到天氣環(huán)境、施工、人為等突發(fā)因素影響,以上導(dǎo)致運(yùn)維工作量極大。
第二,新業(yè)務(wù)層出不窮,對(duì)網(wǎng)絡(luò)質(zhì)量要求也越來越高。除上網(wǎng)瀏覽、網(wǎng)絡(luò)電視、網(wǎng)上購物、網(wǎng)絡(luò)社交、長短視頻播放、在線游戲外,視頻直播、AR/VR、元宇宙等新業(yè)務(wù)不斷涌現(xiàn)。受疫情影響,用戶的工作和學(xué)習(xí)越來越多的依靠在家里或公司通過網(wǎng)絡(luò)會(huì)議和網(wǎng)上課堂的方式進(jìn)行。這些業(yè)務(wù)對(duì)有線寬帶網(wǎng)絡(luò)質(zhì)量要求極高(有的帶寬甚至?xí)_(dá)到Gbps、時(shí)延ms級(jí)),對(duì)網(wǎng)絡(luò)質(zhì)差容忍度低,一旦發(fā)生網(wǎng)絡(luò)質(zhì)量劣化或故障、修復(fù)不及時(shí),極易造成用戶投訴和滿意度下降。
但是,由于單段線路網(wǎng)絡(luò)質(zhì)量QoS指標(biāo)難以完全反映業(yè)務(wù)端到端的質(zhì)量情況,QoS與業(yè)務(wù)質(zhì)量/用戶體驗(yàn)之間并非線性對(duì)應(yīng)關(guān)系;不同業(yè)務(wù)在QoS對(duì)用戶體驗(yàn)影響敏感性和程度上存在差異;另外業(yè)務(wù)技術(shù)也在基于網(wǎng)絡(luò)質(zhì)量情況進(jìn)行適配演進(jìn)。因此,面對(duì)用戶提出的用戶體驗(yàn)上的投訴問題,缺乏對(duì)用戶感知數(shù)據(jù)的采集,僅基于網(wǎng)絡(luò)側(cè)QoS指標(biāo)往往很難追查,用戶問題往往被大量的QoS重復(fù)告警所湮沒。
第三,對(duì)于家庭網(wǎng)絡(luò)和有線接入的企業(yè)寬帶網(wǎng)絡(luò),存在大量非運(yùn)營商管控的用戶終端設(shè)備,處于監(jiān)管盲區(qū)。用戶滿意度受這些用戶自有終端的使用情況,以及用戶主觀行為和習(xí)慣的影響。因此,當(dāng)出現(xiàn)用戶粒度質(zhì)差和投訴時(shí),一大部分問題難以通過網(wǎng)絡(luò)側(cè)來發(fā)現(xiàn)和定位問題,經(jīng)常需要人工上門處理。
圖1有線寬帶網(wǎng)絡(luò)架構(gòu)
綜上,有線寬帶網(wǎng)絡(luò)亟需采集與用戶感知相關(guān)的質(zhì)量數(shù)據(jù),打開用戶內(nèi)網(wǎng)監(jiān)管盲區(qū),以更準(zhǔn)確更全面地進(jìn)行用戶網(wǎng)絡(luò)質(zhì)量問題的發(fā)現(xiàn)和診斷;同時(shí),亟需引入智能運(yùn)維技術(shù),在關(guān)鍵運(yùn)維環(huán)節(jié)進(jìn)行必要的人工替代,以提高運(yùn)維效率和運(yùn)維質(zhì)量。通過對(duì)用戶業(yè)務(wù)質(zhì)量感知的全面掌握和智能手段的充分利用,才能緩解目前有線寬帶運(yùn)維面臨的巨大壓力,切實(shí)提高網(wǎng)絡(luò)質(zhì)量,降低被動(dòng)投訴,提升有線寬帶用戶滿意度。
二、 有線寬帶運(yùn)維的典型需求場(chǎng)景
1、網(wǎng)絡(luò)故障(質(zhì)差)的異常發(fā)現(xiàn)
(1)上網(wǎng)業(yè)務(wù)量升降異常發(fā)現(xiàn)
當(dāng)有線寬帶某個(gè)網(wǎng)元或線路發(fā)生故障時(shí),一般都伴隨相關(guān)業(yè)務(wù)的用戶數(shù)或業(yè)務(wù)訪問量發(fā)生驟降或波動(dòng),如用戶上網(wǎng)用戶數(shù)、上網(wǎng)流量、訪問次數(shù)等指標(biāo)(圖2),此類異常往往預(yù)示著網(wǎng)絡(luò)發(fā)生問題并影響了用戶業(yè)務(wù)正常訪問,需被及時(shí)發(fā)現(xiàn)告警并被核查修復(fù)。如果發(fā)生故障的業(yè)務(wù)量指標(biāo)的時(shí)序本身就有一定的周期波動(dòng)性,則較難通過簡單靜態(tài)閾值方式進(jìn)行檢測(cè)。
圖2 網(wǎng)絡(luò)發(fā)生問題時(shí)導(dǎo)致業(yè)務(wù)量指標(biāo)異常
(2)互聯(lián)網(wǎng)電視質(zhì)差告警故障發(fā)現(xiàn)
基于有線寬帶網(wǎng)絡(luò)的互聯(lián)網(wǎng)電視業(yè)務(wù),如IPTV,其體驗(yàn)質(zhì)差告警,正常情況下一般由個(gè)別用戶原因造成,時(shí)序一般呈隨機(jī)分布;而若由某一網(wǎng)元或線路群障造成,則時(shí)序呈現(xiàn)出聚集突增情況(圖3)。使用靜態(tài)閾值方法,對(duì)不同告警時(shí)序模式需設(shè)置較多靜態(tài)閾值,耗費(fèi)人力且難以管理;業(yè)務(wù)發(fā)生變動(dòng)時(shí)還需重新調(diào)整;另外單一靜態(tài)閾值還容易造成漏警或誤警。
圖3 網(wǎng)絡(luò)電視故障時(shí)產(chǎn)生質(zhì)差告警激增
2、網(wǎng)絡(luò)故障(質(zhì)差)的根因定位
(1)互聯(lián)網(wǎng)電視故障根因定位
互聯(lián)網(wǎng)電視業(yè)務(wù)質(zhì)量出現(xiàn)問題,原因涉及通信網(wǎng)絡(luò)、內(nèi)容服務(wù)器、以及CDN等,或其相互交叉影響造成。由于以上各原因的子維度和節(jié)點(diǎn)眾多,發(fā)生電視卡頓故障時(shí)進(jìn)行根因定位時(shí),面臨巨大和復(fù)雜的維度搜索空間(圖4),僅靠人工逐級(jí)定位分析,定位慢耗時(shí)長。
圖4 互聯(lián)網(wǎng)電視發(fā)生故障時(shí)根因定位面臨的維度搜索空間
(2)家庭內(nèi)網(wǎng)質(zhì)差定位
家庭內(nèi)網(wǎng)是有線寬帶網(wǎng)絡(luò)的用戶側(cè)末梢,運(yùn)營商不完全管控,是網(wǎng)絡(luò)運(yùn)維的難點(diǎn)和痛點(diǎn)。家庭內(nèi)網(wǎng)質(zhì)量易受到家庭網(wǎng)關(guān)、帶寬、用戶終端、組網(wǎng)部署方式、第三方路由器、Wi-Fi覆蓋和同頻干擾、網(wǎng)口/網(wǎng)線連接等多因素的影響,也和用戶使用位置和習(xí)慣有關(guān)。用戶常見感知的質(zhì)差問題現(xiàn)象是“上網(wǎng)慢”“網(wǎng)速不穩(wěn)定”等。出現(xiàn)以上投訴,由于排障規(guī)則復(fù)雜和用戶差異大,往往依賴裝維人員上門,根據(jù)專家經(jīng)驗(yàn)現(xiàn)場(chǎng)分步逐項(xiàng)嘗試排查,耗時(shí)長效率低成本高。同時(shí)裝維人員的經(jīng)驗(yàn)積累慢,相互之間較難得到復(fù)用,導(dǎo)致排障技術(shù)門檻高。
3、用戶上網(wǎng)滿意度預(yù)測(cè)
隨著帶寬步入千兆,有線寬帶用戶的上網(wǎng)滿意度成為運(yùn)營商的重要競(jìng)爭(zhēng)點(diǎn)。若能有效預(yù)測(cè)用戶的不滿程度,可以幫助運(yùn)營商提前發(fā)現(xiàn)潛在質(zhì)差用戶,及時(shí)采取措施,以避免用戶投訴和用戶流失。但用戶滿意度影響因素多,不僅包括各類質(zhì)量問題,還涉及用戶資費(fèi)、業(yè)務(wù)差異、感受差異等因素,通過個(gè)別指標(biāo)和閾值進(jìn)行推斷用戶滿意度,難度較大,還有較多技術(shù)問題有待突破。
三、 自智網(wǎng)絡(luò)技術(shù)發(fā)展現(xiàn)狀
伴隨數(shù)字經(jīng)濟(jì)高速增長,人們生活日益依賴網(wǎng)絡(luò),基于網(wǎng)絡(luò)的各類業(yè)務(wù)不斷涌現(xiàn),沉浸式用戶體驗(yàn)對(duì)網(wǎng)絡(luò)質(zhì)量的要求也不斷提高。運(yùn)營商的網(wǎng)絡(luò)覆蓋范圍、網(wǎng)元數(shù)量成倍增加,網(wǎng)絡(luò)管理復(fù)雜度呈指數(shù)性增加,以“人工為主”的網(wǎng)絡(luò)運(yùn)維體系應(yīng)對(duì)越來越力不從心,亟需在一些關(guān)鍵運(yùn)維場(chǎng)景引入“智能”手段來實(shí)現(xiàn)運(yùn)營商網(wǎng)絡(luò)運(yùn)維的 “提質(zhì)、增效、降本”。
2019年電信管理論壇TMF成立“自智網(wǎng)絡(luò)項(xiàng)目”,旨在構(gòu)建業(yè)界領(lǐng)先、端到端網(wǎng)絡(luò)自動(dòng)化、智能化的方法,幫助運(yùn)營商簡化業(yè)務(wù)部署,推動(dòng)網(wǎng)絡(luò)Self-X能力(自服務(wù)、自發(fā)放、自保障)全面提升,為用戶提供Zero-X(零等待、零接觸、零故障)體驗(yàn)。這為運(yùn)營商網(wǎng)絡(luò)運(yùn)維的智能化轉(zhuǎn)型明晰了目標(biāo)和實(shí)現(xiàn)路徑,成為通信行業(yè)的發(fā)展共識(shí)。
中國移動(dòng)參考TMF自智網(wǎng)絡(luò)理念,基于自身實(shí)際,規(guī)劃網(wǎng)絡(luò)運(yùn)維的數(shù)智化轉(zhuǎn)型,加大自動(dòng)化、智能化能力建設(shè),面向流程定義場(chǎng)景化分級(jí)標(biāo)準(zhǔn),分步迭代提升網(wǎng)絡(luò)運(yùn)維自治水平,設(shè)定了2025年網(wǎng)絡(luò)運(yùn)維自治水平達(dá)到L4的整體目標(biāo)(運(yùn)維分級(jí)見表1)。同時(shí)提出“2+5+N”的網(wǎng)管系統(tǒng)總體規(guī)劃,體系化指導(dǎo)網(wǎng)管系統(tǒng)能力建設(shè),以拉通運(yùn)維流程,補(bǔ)齊自動(dòng)化業(yè)務(wù)配置激活,夯實(shí)數(shù)據(jù)底座,強(qiáng)化端到端業(yè)務(wù)保障,實(shí)現(xiàn)能力復(fù)用共享,針對(duì)性完善能力短板。
四、 基于用戶業(yè)務(wù)感知的有線寬帶智能運(yùn)維系統(tǒng)
以上章節(jié)對(duì)有線寬帶網(wǎng)絡(luò)運(yùn)維當(dāng)前面臨問題,自智網(wǎng)絡(luò)發(fā)展?fàn)顩r等進(jìn)行介紹。本章基于中國移動(dòng)“極目云智”系統(tǒng)的實(shí)踐,提出構(gòu)建基于用戶業(yè)務(wù)感知的有線寬帶智能運(yùn)維系統(tǒng)的技術(shù)方案,希望能為有線寬帶網(wǎng)絡(luò)發(fā)展和自智網(wǎng)絡(luò)水平提升,提供參考。
1、有線寬帶智能運(yùn)維系統(tǒng)技術(shù)架構(gòu)及關(guān)鍵技術(shù)
基于用戶業(yè)務(wù)感知的有線寬帶智能運(yùn)維系統(tǒng),涉及海量的用戶業(yè)務(wù)感知數(shù)據(jù)的處理,且面向有線寬帶智能運(yùn)維主題,因此具有典型大數(shù)據(jù)采集、處理和存儲(chǔ)流程,以及AI模型學(xué)習(xí)過程的技術(shù)特征。
基于用戶業(yè)務(wù)感知的有線寬帶智能運(yùn)維系統(tǒng),從架構(gòu)上可分為四層(圖5):業(yè)務(wù)感知采集層、運(yùn)維數(shù)據(jù)服務(wù)層、智能運(yùn)維應(yīng)用層、智能運(yùn)維策略層,下面逐層介紹其功能和關(guān)鍵技術(shù)。
圖5 基于用戶業(yè)務(wù)感知的有線寬帶智能運(yùn)維系統(tǒng)架構(gòu)
(1)業(yè)務(wù)感知采集層
業(yè)務(wù)感知采集層,由相關(guān)網(wǎng)元和終端上的業(yè)務(wù)感知模塊組成。這些模塊采集網(wǎng)絡(luò)質(zhì)量、業(yè)務(wù)質(zhì)量和用戶體驗(yàn)指標(biāo);同時(shí)也接受平臺(tái)管控和配置,可按需按策略進(jìn)行業(yè)務(wù)、網(wǎng)絡(luò)性能監(jiān)測(cè)和撥測(cè)。業(yè)務(wù)感知采集層可周期性或根據(jù)條件觸發(fā),上報(bào)采集加工過的各類指標(biāo)數(shù)據(jù)。
(2)運(yùn)維數(shù)據(jù)服務(wù)層
運(yùn)維數(shù)據(jù)服務(wù)層,對(duì)業(yè)務(wù)感知采集層上報(bào)的大數(shù)據(jù),進(jìn)行計(jì)算處理,以數(shù)據(jù)倉庫方式對(duì)運(yùn)維數(shù)據(jù)進(jìn)行分層處理、加工和存儲(chǔ),并向智能運(yùn)維應(yīng)用層提供面向具體應(yīng)用場(chǎng)景的主題數(shù)據(jù)服務(wù)。
運(yùn)維數(shù)據(jù)倉庫主要使用Hive及SQL技術(shù)。大數(shù)據(jù)計(jì)算引擎,負(fù)責(zé)數(shù)據(jù)倉庫的分層加工處理,根據(jù)數(shù)據(jù)處理要求可進(jìn)行離線計(jì)算和實(shí)時(shí)計(jì)算,主要技術(shù)有Spark/Spark Streaming和Flink等。
為支持知識(shí)圖譜技術(shù),還提供以Neo4j為主的圖數(shù)據(jù)庫,用于面向運(yùn)維特定領(lǐng)域知識(shí)圖譜的知識(shí)表示、知識(shí)儲(chǔ)存和知識(shí)查詢。
(3)智能運(yùn)維應(yīng)用層
在智能運(yùn)維應(yīng)用層,運(yùn)行有各種典型運(yùn)維場(chǎng)景的智能應(yīng)用模塊,根據(jù)具體運(yùn)維場(chǎng)景需求,從運(yùn)維數(shù)據(jù)服務(wù)層提取對(duì)應(yīng)主題數(shù)據(jù),通過AI算法模型,開展異常檢測(cè)、根因定位、質(zhì)差預(yù)測(cè)等典型運(yùn)維任務(wù),并將結(jié)果上報(bào)智能運(yùn)維策略層。同時(shí)在此層,建設(shè)有智能算法庫(Scikit-Learn、TenforFlow、PyTorch等)、數(shù)據(jù)特征工程、模型訓(xùn)練環(huán)境、樣本標(biāo)記、算法效果評(píng)估等模塊,以支撐以上具體應(yīng)用模塊的全生命周期運(yùn)行。
(4)智能運(yùn)維策略層
智能運(yùn)維策略層,接收智能運(yùn)維應(yīng)用層的運(yùn)行結(jié)果,按運(yùn)維流程,運(yùn)行告警派單、策略執(zhí)行;面向管理人員支持策略編輯、流程編排;同時(shí)對(duì)派單結(jié)果進(jìn)行回單確認(rèn),運(yùn)維案例積累,并反饋智能運(yùn)維應(yīng)用層,形成迭代優(yōu)化閉環(huán)。
3、有線寬帶智能運(yùn)維系統(tǒng)的應(yīng)用探索
(1)異常檢測(cè)
異常檢測(cè)是在時(shí)間序列中查找出與預(yù)期行為不符的模式。在有線寬帶運(yùn)維場(chǎng)景中,在網(wǎng)絡(luò)環(huán)境穩(wěn)定、設(shè)備運(yùn)行正常的情況下,網(wǎng)絡(luò)性能指標(biāo)應(yīng)保持穩(wěn)定,而在發(fā)生異常(如突增、突降、抖動(dòng))時(shí)則往往伴隨著網(wǎng)絡(luò)故障或潛在質(zhì)差。通過異常檢測(cè)算法可在網(wǎng)絡(luò)質(zhì)量、業(yè)務(wù)質(zhì)量或用戶感知指標(biāo)時(shí)序中高效快速發(fā)現(xiàn)異常問題,減少繁多指標(biāo)曲線的人工處理成本,以便運(yùn)維人員或系統(tǒng)做出及時(shí)反應(yīng),減少甚至不對(duì)用戶造成影響。
異常檢測(cè)算法的思路是找出與“正常值”不一樣的“異常點(diǎn)”或“異常區(qū)段”,主要方法包括:根據(jù)統(tǒng)計(jì)學(xué)原理的算法,如3-Sigma、ARIMA、EWMA、Holt-Winters、Prophet等;為減少大量的手動(dòng)算法和參數(shù)選擇,可使用KNN、K-means、LOF、OCSVM、iForest等傳統(tǒng)機(jī)器學(xué)習(xí)算法;針對(duì)多維指標(biāo)時(shí)序,可嘗試?yán)肰AE、GAN、LSTM、CNN技術(shù)的Donut、Buzz、Informer等深度學(xué)習(xí)算法。
對(duì)上網(wǎng)業(yè)務(wù)量升降異常發(fā)現(xiàn)問題,可借助能對(duì)周期性指標(biāo)時(shí)序序列進(jìn)行智能檢測(cè)的算法,如ARIMA、Donut等,通過對(duì)指標(biāo)的歷史時(shí)序規(guī)律的分析,排除周期(如星期、時(shí)段)波動(dòng)性的影響,以更全面更準(zhǔn)確地檢測(cè)出異常,尤其是篩查出隱蔽異常。
對(duì)互聯(lián)網(wǎng)電視質(zhì)差告警故障發(fā)現(xiàn)問題,可基于業(yè)務(wù)質(zhì)差告警信息,利用大數(shù)據(jù)處理技術(shù),形成多維度的時(shí)序序列,通過異常檢測(cè)智能算法,如OCSVM、iForest、Informer等,挖掘歷史數(shù)據(jù)分布規(guī)律和模式,區(qū)分重要異常與普通告警,自動(dòng)檢測(cè)告警異常突增聚集事件,降低調(diào)校靜態(tài)閾值工作量,提升異常發(fā)現(xiàn)的查全率和及時(shí)性,減少漏警或誤警。
(2)根因定位
根因定位在被檢測(cè)出網(wǎng)絡(luò)質(zhì)量、業(yè)務(wù)質(zhì)量或用戶感知指標(biāo)異常之后被觸發(fā),在指標(biāo)的多維屬性空間中快速定位找出導(dǎo)致異常的屬性組合。當(dāng)發(fā)生異常或故障時(shí),根因定位算法能自動(dòng)準(zhǔn)確地推薦出故障根因,從而能指導(dǎo)運(yùn)維人員去修復(fù)或者自動(dòng)調(diào)度系統(tǒng)采取修復(fù)措施。目前有線寬帶故障排查定位多需要人工經(jīng)驗(yàn)逐級(jí)查找,效率低有效性差。通過根因定位算法替代人工,從而大幅減少修復(fù)時(shí)間和運(yùn)維成本,降低用戶業(yè)務(wù)質(zhì)量下降或業(yè)務(wù)中斷時(shí)間,補(bǔ)救提升用戶滿意度。
根因定位算法的思路是使用高效搜索算法,在眾多維度屬性組合集中找出對(duì)指標(biāo)異常影響最大、解釋性最強(qiáng)、或關(guān)聯(lián)性最強(qiáng)的屬性組合。常見的根因定位算法有兩類:針對(duì)多維指標(biāo)下鉆的HotSpot、iDice、Squeeze等;基于關(guān)聯(lián)規(guī)則挖掘機(jī)制的有InfoCom、Sigmetrics等算法。
對(duì)互聯(lián)網(wǎng)電視質(zhì)差故障根因定位問題,可使用大數(shù)據(jù)對(duì)故障時(shí)間段內(nèi)的質(zhì)差指標(biāo)進(jìn)行統(tǒng)計(jì)形成多維組合因素的時(shí)間序列,測(cè)度包括質(zhì)差維度、測(cè)度、時(shí)間等信息,然后采取相應(yīng)根因定位算法,如等,對(duì)各因素維度組合的影響度/貢獻(xiàn)度進(jìn)行快速搜索和排序,得出最有可能的根因結(jié)果建議。
對(duì)于家庭內(nèi)網(wǎng)的質(zhì)差定位,知識(shí)圖譜(Knowledge Graph)是較為有效的一種技術(shù)。它以結(jié)構(gòu)化的形式描述客觀世界中概念、實(shí)體及其關(guān)系,提供了一種更好地組織、管理和理解海量信息的能力,是推動(dòng)機(jī)器具有認(rèn)知智能的關(guān)鍵技術(shù)。知識(shí)圖譜可以分為通用知識(shí)圖譜(領(lǐng)域無關(guān))和特定領(lǐng)域知識(shí)圖譜。
網(wǎng)絡(luò)運(yùn)維是網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)與專家經(jīng)驗(yàn)高度結(jié)合的領(lǐng)域,只有將故障處理知識(shí)與網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)有效結(jié)合,通過知識(shí)圖譜技術(shù),構(gòu)建一個(gè)有知識(shí)能推理的“在線運(yùn)維專家系統(tǒng)”,能更有效輔助故障定位、推理根因,提高一線裝維人員效率。
對(duì)家庭內(nèi)網(wǎng)質(zhì)差分析問題,可基于多類業(yè)務(wù)感知和網(wǎng)管系統(tǒng)數(shù)據(jù),以家庭用戶粒度進(jìn)行數(shù)據(jù)聚類模式分析,通過人工智能,如概率圖、神經(jīng)網(wǎng)絡(luò)等算法,對(duì)不同家庭網(wǎng)絡(luò)拓?fù)洌ㄈ缬袩o第三方路由器、智能組網(wǎng))、家庭設(shè)備類型及Wi-Fi性能等多種因素與業(yè)務(wù)質(zhì)量影響的關(guān)聯(lián)性及因果關(guān)系進(jìn)行建模,形成家庭內(nèi)網(wǎng)質(zhì)差定位模型;導(dǎo)入專家經(jīng)驗(yàn)和排障實(shí)例,運(yùn)用知識(shí)圖譜等技術(shù),形成裝維專家規(guī)則庫;基于采集的家庭網(wǎng)絡(luò)用戶畫像數(shù)據(jù),利用裝維專家規(guī)則庫推理家庭內(nèi)網(wǎng)質(zhì)差的可能原因和改善建議,逐步積累和提升家庭網(wǎng)絡(luò)質(zhì)差智能分析能力,降低一線裝維技術(shù)門檻。
(3)質(zhì)差預(yù)測(cè)
質(zhì)差預(yù)測(cè)是根據(jù)歷史數(shù)據(jù)情況,預(yù)測(cè)未來某一時(shí)間或區(qū)間的質(zhì)差劣化情況或故障事件。針對(duì)重點(diǎn)業(yè)務(wù)的質(zhì)差預(yù)測(cè),可讓運(yùn)維人員能提前發(fā)現(xiàn)用戶潛在質(zhì)差或故障,從而進(jìn)行提前采取優(yōu)化或應(yīng)對(duì)措施,把問題消滅在發(fā)生之前或減輕影響。主動(dòng)的異常管理已成為一種提高網(wǎng)絡(luò)服務(wù)穩(wěn)定性的有效方法。
質(zhì)差預(yù)測(cè)的思路是基于歷史標(biāo)記數(shù)據(jù),利用分類和回歸,對(duì)當(dāng)前時(shí)刻的指標(biāo)值或質(zhì)差概率進(jìn)行預(yù)測(cè),主要方法有:基于統(tǒng)計(jì)學(xué)理論的SVR、ARIMA、Holt-Winters、Prophet等算法;基于傳統(tǒng)機(jī)器學(xué)習(xí)的LR、SVM、Random Forest、XGBoost、LightGBM等算法;以及基于深度學(xué)習(xí)的RNN、LSTM、DeepAR、Transformer、Informer、TabNet等。
對(duì)用戶上網(wǎng)滿意度問題,結(jié)合網(wǎng)絡(luò)質(zhì)量、業(yè)務(wù)質(zhì)量、用戶感知、用戶訂購和歷史投訴等數(shù)據(jù),通過用戶畫像技術(shù)構(gòu)建與滿意度相關(guān)的各類用戶特征。用戶特征作為輸入,用戶滿意度調(diào)研結(jié)果作為標(biāo)簽,應(yīng)用機(jī)器學(xué)習(xí)的分類算法模型對(duì)用戶寬帶滿意度級(jí)別進(jìn)行預(yù)測(cè),以發(fā)現(xiàn)潛在不滿或質(zhì)差用戶。
五、 總結(jié)與展望
中國移動(dòng)有線寬帶運(yùn)維亟需智能技術(shù)來緩解來自用戶和業(yè)務(wù)發(fā)展的巨大壓力,以實(shí)現(xiàn)網(wǎng)絡(luò)的“提質(zhì)、增效、降本”,同時(shí)提升用戶滿意度。基于用戶業(yè)務(wù)感知數(shù)據(jù),構(gòu)建有線寬帶智能運(yùn)維系統(tǒng)解決方案,對(duì)典型運(yùn)維場(chǎng)景基于AI算法模型的應(yīng)用探索,可由點(diǎn)成線再到面,為有線寬帶智能運(yùn)維體系的建設(shè)發(fā)展提供技術(shù)參考和應(yīng)用指引。
上述解決方案已在異常發(fā)現(xiàn)、故障根因定位等典型運(yùn)維場(chǎng)景進(jìn)行應(yīng)用,在部分省公司進(jìn)行了試點(diǎn)和落地,并初見成效。但全面來看,系統(tǒng)在邊緣智能感知增強(qiáng)、新型網(wǎng)管系統(tǒng)建設(shè)優(yōu)化、端到端網(wǎng)管數(shù)據(jù)分析協(xié)同、智能運(yùn)維場(chǎng)景拓展等方面需要進(jìn)一步優(yōu)化完善。愿與業(yè)界一起就以上問題加強(qiáng)研究溝通,共同推動(dòng)技術(shù)演進(jìn)和應(yīng)用創(chuàng)新,加快有線寬帶智能運(yùn)維技術(shù)在中國移動(dòng)的成熟落地和成效提升。