云智慧打造國網(wǎng)信通綜合運維管理門戶
客戶介紹
國家電網(wǎng)公司信息通信分公司(以下簡稱“信通公司”)受國家電網(wǎng)公司委托,承擔(dān)公司投資及組織的骨干通信網(wǎng)以及骨干信息網(wǎng)的建設(shè)管理,承擔(dān)涉及公司總部電網(wǎng)調(diào)度和管理通信業(yè)務(wù)的通信網(wǎng)及骨干信息網(wǎng)的運行和維護(hù)等工作,承擔(dān)總部、公司一級部署和相關(guān)直屬單位信息系統(tǒng)的運行維護(hù)等工作,同時承擔(dān)總部信息、通信技術(shù)支持、科研成果和專利管理等服務(wù)工作。
客戶痛點
1.信息分散:雖然有多個運維工具,但各工具只管理了系統(tǒng)的一部分;
2.關(guān)系缺失:各系統(tǒng)中設(shè)備信息相對獨立,沒有進(jìn)行有效的組織展示;
3.數(shù)據(jù)缺失:有些系統(tǒng)管理存在重復(fù)的情況,數(shù)據(jù)以哪個系統(tǒng)為準(zhǔn)不清楚;
4.缺少統(tǒng)一的Portal:無法供內(nèi)部發(fā)布服務(wù)目錄和外部訪問;
5.缺乏統(tǒng)一數(shù)據(jù)共享平臺對數(shù)據(jù)進(jìn)行關(guān)聯(lián)、整合及聯(lián)通,數(shù)據(jù)不能共享,難以釋放數(shù)據(jù)真正的價值,其他系統(tǒng)無法方便的使用資源信息;
6.缺少應(yīng)用視角的指標(biāo)關(guān)聯(lián)、分類分級、基線告警、下鉆分析。
解決方案
方案以全局監(jiān)控及智能運維平臺滿足數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)存儲技術(shù)、大規(guī)模數(shù)據(jù)離線計算分析、異常檢測技術(shù)、故障診斷和分析的需求,實踐平臺化思維,充分利用現(xiàn)有監(jiān)控資源,實現(xiàn)復(fù)雜業(yè)務(wù)模型下的異常檢測、故障定位、決策分析支持,并構(gòu)建一套完整的技術(shù)生態(tài)體系,提升整體的運維服務(wù)能力,給予客戶美觀友好的可視化界面。
1.數(shù)據(jù)源:數(shù)據(jù)庫管理、存儲管理、三維可視化、CMDB、綜合網(wǎng)管;
2.運維大數(shù)據(jù)采集層和數(shù)據(jù)傳輸層:與各類監(jiān)控平臺對接,獲取生產(chǎn)環(huán)境資源數(shù)據(jù)、運維指標(biāo)數(shù)據(jù)和告警數(shù)據(jù),并將這些數(shù)據(jù)傳輸?shù)桨⒗镌茢?shù)據(jù)中臺進(jìn)行處理;
3.運維大數(shù)據(jù)實時計算層:平臺對阿里數(shù)據(jù)中臺的數(shù)據(jù)進(jìn)行二次數(shù)據(jù)清洗、數(shù)據(jù)聚類、指標(biāo)運算等操作,以保證數(shù)據(jù)滿足實際功能需求;
4.運維大數(shù)據(jù)存儲層:建設(shè)數(shù)據(jù)存儲層,將生產(chǎn)環(huán)境基礎(chǔ)資源數(shù)據(jù)、關(guān)鍵指標(biāo)數(shù)據(jù)、告警數(shù)據(jù)放在存儲層(大數(shù)據(jù)數(shù)據(jù)湖和監(jiān)控平臺數(shù)據(jù)湖)統(tǒng)一長期存儲;
5.服務(wù)層:集成各類告警、性能及IT運營數(shù)據(jù),構(gòu)建各類數(shù)據(jù)主題和定制化數(shù)據(jù),并提供實時消費服務(wù)能力,同時具備開放的接口服務(wù)能力;
6.計算層:通過數(shù)據(jù)分析、數(shù)據(jù)建模、機(jī)器學(xué)習(xí)等人工智能技術(shù),基于歷史運維大數(shù)據(jù)進(jìn)行數(shù)據(jù)分析、模型訓(xùn)練,最終實現(xiàn)對實時在線運維數(shù)據(jù)(數(shù)據(jù)實時運算庫)的關(guān)聯(lián)分析;
7.應(yīng)用展現(xiàn)層:基于對運維大數(shù)據(jù)的智能分析,針對具體的主機(jī)、存儲、應(yīng)用系統(tǒng)、業(yè)務(wù)場景和運維場景,形成運維人員視圖,并提供異常檢測、故障定位、決策支持以及分析預(yù)測等支持;結(jié)合實時分析告警和自動化化的運維操作,通過開發(fā)可視化的頁面或大屏的形式實時展現(xiàn)業(yè)務(wù)系統(tǒng)智能運維的關(guān)鍵指標(biāo),第一時間發(fā)現(xiàn)異常情況,輔助運維人員進(jìn)行運維決策和自動化處理。
價值
運維全景狀態(tài),基于的實時數(shù)據(jù)形成資產(chǎn)整體情況、運行狀態(tài)、告警信息作業(yè)執(zhí)行情況實現(xiàn)運維全局掌控。統(tǒng)一告警管理,對告警消息進(jìn)行統(tǒng)一的接入與處理,從而實現(xiàn)問題事件全生命周期的全局管控、告警的關(guān)聯(lián)分析。
1.展現(xiàn)系統(tǒng)之間的應(yīng)用調(diào)用的過程,支持手動托拉拽的方式繪制業(yè)務(wù)場景,包含多個服務(wù)及應(yīng)用;
2.展現(xiàn)全局業(yè)務(wù)健康狀態(tài),通過整合各類數(shù)據(jù),形成應(yīng)用畫像、準(zhǔn)實時展示應(yīng)用生死指標(biāo)、關(guān)鍵指標(biāo)。基于數(shù)據(jù)治理,整合各類數(shù)據(jù),實現(xiàn)資源信息管理、統(tǒng)一檢索、統(tǒng)一查看;
3.平臺通過定制的方式,幫助國網(wǎng)信通展示現(xiàn)有IT資源的總覽視圖和IT資源的健康情況。