數據倉庫在移動通信企業經營分析系統中的應用
一般來說,在企業構建分析型系統之前,都會已經存在若干的業務系統。來自這些系統的數據代表了企業目前的業務狀況。這些數據一般是高粒度的,即達到非常細節的程度(例如移動通信行業里面的詳細通話記錄等)。來自移動業務系統的實時數據是企業數據倉庫的最重要的數據來源,但是,在這些數據進入數據倉庫之前,必須經過抽取、轉換、加載等多個工序的處理。
典型的數據抽取接口包括數據庫接口和文件接口,對于不同的數據平臺、不同源數據形式、不同性能要求和業務量的源數據以及不同數據量的源數據,采取不同的數據抽取接口。數據轉換是指從業務系統中抽取的源數據根據數據倉庫系統模型的要求,進行數據的轉換、清洗、合并、拆分、匯總等處理,保證來自不同系統、不同格式的數據的一致性和完整性。數據加載就是將從數據源系統中抽取轉換后的數據加載到數據倉庫系統中。數據加載策略要考慮加載周期以及數據追加策略方面的問題。
對于數據的抽取與轉換過程中發現的錯誤數據,在加載到數據倉庫的同時,打上錯誤數據的標簽,并結邏輯上集中存放。
目前,移動通信行業已經建立起自己的BOSS(Business Operation Support System)系統,對自身的計費系統和客戶服務系統等專業業務系統數據進行了整合。這就是經營分析主要的數據源。
經營分析數據處理的意義在于通過處理,一方面提高數據的質量;另一方面,使數據從適應業務系統(OLTP)的數據模式轉換為適應分析系統的數據模式。
5 經營分析系統中數據分析的實現
數據分析技術是建立在一定的數據基礎上的,進行分析的方法通常包括:OLAP分析、數據挖掘、統計分析、聯機挖掘(OLAM)等。需要說明的是,數據分析技術不一定要建立在數據倉庫基礎上,但有了數據倉庫,數據分析的效率和能力將大大提高。
移動通信企業經營分析系統分析部分的邏輯結構主要分三部分:服務器,其中包括網絡應用服務器與查詢服務器兩個模塊;以Client/Server方式的客戶端;以Web方式的客戶端。
網絡應用服務器可以讓客戶在網上查詢、集中管理客戶、報表的安全性和可適應得報表。查詢服務器按照預定時間自動進行查詢處理并通過E-mail、網絡、打印機和Web分發報表。
移動通信企業經營分析系統的主界面顯示的是近一季度全公司各種業務的業績水平。具體的分析主題可以通過主界面進行一些功能模塊選擇,主要分為長話流向分析,時段分析,消費水平分析3個功能模塊。
通過對各種角度的需求分析,總結分析內容的一般細化方法。主題的劃分實際上與分析內容的范圍直接相關,主題劃分清楚后,下一步就是細化分析以及根據分析內容的性質確定它在數據倉庫中的位置。通常維元素對應分析角度,而度量對應分析關心的具體指標,在數據倉庫中體現在話費數額,通話張數,通話時長等方面。一個指標究竟是作為維元素、度量還是維屬性,取決于具體的業務需求,但從實際操作中可以總結出如下的概念性經驗:作為維元素或維屬性的通常是離散型的數據,只允許有限的取值;作為度量的是連續型數據,取值無限。如果一定要用連續型數據作為維元素,則必須對其按取值進行分段,以分段值作為實際的維元素,就像為了取消費水平為維元素,就對客戶群的消費水平進行分段。判斷分析指標是作為維元素還是維屬性時,則需綜合考慮這個指標占用的存儲空間與相關查詢的使用頻度。需要強調的是,在細化分析內容的過程中,務必解決指標的歧義問題。在不同報表中以及在業務訪談中同一名稱的指標,是不是在同樣條件限定下,通過同樣方法提取或計算得到的,它們之間的相互關系是什么,這些問題都必須從熟悉業務的分析人員那里得到準確、清晰的答案,否則將影響到模型設計、數據提取、數據展現等多個方面。
6 結語
本文分析和探討了在移動通信企業中建立基于數據倉庫的經營分析系統的若干問題,并進行了相關的設計。但討論尚不全面,需要在工作中繼續研究。
移動通信企業日益增多的信息數據無疑是一個巨大的聚寶盆,通過對數據的不斷分析研究,挖掘出更深層次的內容找出更多有價值的規律,需要企業各層面的人員共同協作、長期參與,而這給移動通信企業帶來的效益也將是源源不斷的。







評論