DevSuite合作中石化武漢乙烯:建立運維服務系統
(1)客戶介紹
武漢大乙烯是中國石油化工集團公司投資建設的大型化工企業。隨著基礎設施建設的逐步完成,投產日期日益臨近,信息技術對武漢大乙烯的業務正常運行愈來愈重要,業務部門用戶對信息技術及信息系統的依賴性愈來愈高。這種依賴性,已經逐步轉化為對IT 部門越來越高的服務要求。
(2)項目背景
武漢大乙烯項目IT 部門目前規劃編制十幾個人,計劃維護的信息系統多達35 個,所有系統在2012 年年底前全部上線。大量系統集中上線,大量IT 運維工作需要管理,如何及時、有效、充分地利用分散在各個IT 運維相關系統平臺中的運維數據信息,提高IT 運維的整體效率與質量?如何為IT 運維團隊提供統一的工作入口,全方位展示IT 運維的整體情況?應對這些挑戰,是現階段首要考慮的問題。
由于IT 運維工作的特點,對IT 運維團隊的人員管理是其核心,其余相關系統都是用于為IT 運維人員提供信息和提升效率的,因此武漢大乙烯IT 部門提出了以IT 運維平臺為核心整合運維數據,建設統一運維門戶的思路,以全方位管理IT 運維情況。
- 主動管理IT服務:通過 IT 服務管理體系建設咨詢,梳理及明確組織和崗位職責,評估資源配置方式,建立及優化流程,為信息管理部建立主動事件響應能力,提升事件解決效率,更為主動地管理IT 服務,建立持續改進的基礎;
- 固化咨詢成果:通過 ServiceWise IT 運營管理軟件平臺將相關咨詢成果固化、推廣,實現平順落地;
- 建設IT服務管理體系:通過 IT 服務管理體系建設,提升信息管理部形象,提升用戶滿意度,取得用戶部門的理解和支持,有效支撐及保障武漢乙烯業務的快速拓展;
- 梳理IT相關職能:提供改善服務響應和用戶滿意度所需的信息技術職能組織結構和轉型建議。提供服務臺、事件及知識庫等流程所涉及各角色的職責、工作接口,建立相應服務績效的目標,評估所需資源配置及獲取方式( 即評估建立自身能力以及外包所需資源、能力和成本,最終明確資源獲取方式)。從而使對業務部門提交的故障申報和服務請求,能夠有統一接口、基于事件嚴重程度的服務標準、對事件響應過程進行持續跟蹤,從而確保事件能夠按照服務標準的要求被受理、響應、處理及反饋;
- 建立高效運維管理模式:建立適合武漢乙烯快速響應,高效解決的運維管理模式,明確相關組織職能劃分、建立崗位職責說明及工作目標,從而使IT 運維在建立專業分工的基礎上,各專職部門可以對所負責領域積累相應知識及使用人員技能能夠更為專精,提升各職能的工作效率和效能;
- 優化運維管理流程:包括服務級別管理(包含服務目錄)、事件及服務請求管理、問題管理、變更與發布管理、配置管理與外包模式。據此可以在日常工作中,統一工作規范,明確相應職責。從而建立穩定的服務能力,并在此基礎上,通過過程改進機制,持續提升服務績效;
- 建立針對關鍵用戶的服務目錄及服務級別目標:基于服務級別目標及目標分解,明確各相關流程的有效性指標,標準化響應時間和信息管理部內部解決時間指標;
- 提升IT運維知識水平:通過 IT 服務管理的相關培訓,進一步提升信息管理部IT 運維相關知識、理論素養和水平;
- 落地IT服務管理體系建設成果:通過 TechExcel ServiceWise 軟件建立符合武漢乙烯發展規劃的IT 運維管理平臺,實現IT 服務管理體系建設成果的落地。以ServiceWise 平臺為核心建立統一運維門戶,綜合利用各個IT 運維相關系統平臺的功能和數據,為武漢乙烯提供高質量的IT 運維服務。
(3)解決方案
在武漢大乙烯ServiceWise IT 運維中心之上建立起整個IT 的“表現層”,集中展示IT 基礎設施的各方面運行狀況。
建立聯動的統一運維門戶
核心價值
建立集監控、服務、展示為一體的IT 運維服務系統,全面保障基礎設施及應用系統的安全、穩定、高效運行。通過IT 運維中心集中展示各類監控與運維信息,并與網絡(NOC)、云資源管理(COC)、安全(SOC)、機房環境(EOC)4 大監控中心和統一呼叫中心(CCC)全面集成,形成聯動的統一運維門戶。
統一運維門戶的實現價值點:
- IT 運維中心負責IT 運維工程師團隊的資源調度管理,面向服務對象(業務部門)提供符合服務目錄SLA 要求的IT 運維服務;員工自助服務門戶建立IT 部門統一的對外形象,在企業內部推廣自助服務模式,降低運維團隊的工作量。
- 統一呼叫中心是一線服務臺與服務對象的交互界面;通過CTI 國際標準接口與IT 運維中心集成,統一呼叫中心通知IT 運維中心建立并追蹤呼叫事件,IT 運維中心為統一呼叫中心提供與電話號碼關聯的用戶信息與歷史運維數據,提高一線服務臺解決率。
- 4 大監控中心負責監視已經發生或即將發生的告警事件;通過集成接口將告警事件及時傳遞給IT 運維中心,盡快調度合適的工程師前往處理,避免影響范圍更大的IT 事故發生。
- 4 大監控中心收集各自管理范圍內的基礎設施數據,傳遞給IT 運維中心的資產庫,為“支撐體系”提供基礎數據。
- 6 大系統通過LDAP 統一身份認證服務器緊密集成,共享用戶身份數據,開通單點登錄,操作者在各系統間操作無需重復登錄,提高工作效率。
事件管理平臺
為了規范武漢乙烯生產和運行環境中的事件管理,加強科技部門內部各部門間的協調配合,盡快解決故障或提供服務支持,為業務 提供穩定、高效、高質的IT 服務,從而建立了事件管理流程。
事件管理平臺助力武漢乙烯實現以下目標:
① . 在成本允許的范圍內盡快恢復IT 服務
- 快速響應服務請求
- 快速處理故障申報
- 溝通事件解決狀態,提升客戶滿意度
② . 進行事件的有效控制
- 單一聯系點
- 按規范記錄事件
- 對事件進行有效分類
- 對事件進行分級管理
- 監視事件處理全生命周期并結束事件
- 定期服務流程回顧
③ . 提供有效的IT 服務管理信息
- 故障處理情況
- 服務支持效率
- 服務質量管理報告
武漢乙烯事件管理流程
武漢乙烯事件管理列表
武漢乙烯事件管理流程涵蓋了事件記錄與分類、一線解決、二線解決、三線解決、協調第三方解決等環節。對于重大事件,應直接 走重大事件流程,協調相關資源進行處理。
問題管理平臺
為了管理武漢乙烯IT生產運行環境中的問題,找出問題的根本原因,并加以解決,防止相關事件的再次發生,從而為客戶提供穩定的IT服務。TechExcel為武漢乙烯工程建立了完整的問題管理流程,從而實現:
- 查明事件或問題產生的根本原因,制定解決方案和防止事件再次發生的預防措施;
- 實施主動性的問題管理,在事件發生之前發現和解決可 能導致事件產生的潛在問題;
- 根據問題分類分級,科學合理地利用 IT 資源,降低 IT 支持成本;
- 通過問題管理,提高 IT 服務質量和服務的可用性,提高 客戶服務滿意度。
變更管理平臺
變更管理涵蓋了變更的發起與分類、評估與審批、實施、復核、關閉等環節,以及預授權變更和緊急變更等子流程。
- 正確引導和管理變更請求;
- 正確評估變更的風險,并制定風險的應對措施;
- 變更和變更實施得到正確記錄,并提供審核統計;
- 減少或者消除變更對系統和服務帶來的風險和影響;
- 控制變更過程,使變更高效完成,對服務質量影響最小。
武漢乙烯變更管理流程
發布管理平臺
TechExcel 部署的發布管理流程為武漢乙烯所管理的IT 環境營造了一個更有效的發布環境,保證了正確的、經過批準和測試的軟硬 件版本被發布實施,從而降低發布風險,保證業務的持續穩定,提高用戶滿意度。同時,為變更管理、配置管理等其他管理流程提 供相關信息和支持,使整個IT 基礎設施更穩定。
發布管理范圍包括武漢乙烯分公司開發、維護的涉及所有發布類型的信息系統軟硬件的發布。發布類型具體如下:
- 常規發布:多屬計劃內發布,是指常態的、按照計劃定期發布的已授權發布負責人實施的發布,此發布情況每月監控;版本發布、 配置基線發布;
- 重大發布:多屬非計劃內發布,如新產品 / 項目發布、重大硬件發布等;
- 緊急發布:系統故障、缺陷影響關鍵業務或重要領導交辦的因緊急變更引起的發布。
配置管理平臺
配置管理提供了統一、一致的流程來管理武漢乙烯的IT 資源(包括業務系統),從而實現:
- 所有配置項(即 CI)被識別和記錄下來;
- 配置項當前和歷史狀態得到跟蹤及匯報;
- 配置項記錄的完整性及準確性得到維護和確認;
- IT 生產環境的穩定性。
此流程為配置管理的日常執行流程,主要指變更管理流程發起的對配置信息的修改。
此流程為配置管理的管理規劃主流程,主要提供配置管理規劃、配置項識別與標識、驗證與審計、配置管理回顧等活動。流程始于配置管理的規劃,結束于配置管理工作的回顧。
(4)價值體現
TechExcel ServiceWise 平臺是以流程為核心、給予ITIL 標準的IT 服務管理工具,ServiceWise IT 運維系統平臺為武漢乙烯項目建立了集監控、服務、展示為一體的IT 運維服務系統,全面保障基礎設施及應用系統的安全、穩定、高效運行,并且綜合利用各 個IT 運維相關系統平臺的功能和數據,為其提供高質量的IT 運維服務。建立整個IT“表現層”