新聞中心

EEPW首頁 > 手機與無線通信 > 設計應用 > 數(shù)據(jù)倉庫在移動通信企業(yè)經營分析系統(tǒng)中的應用

數(shù)據(jù)倉庫在移動通信企業(yè)經營分析系統(tǒng)中的應用

作者: 時間:2009-08-28 來源:網絡 收藏

4 處理的實現(xiàn)

一般來說,在企業(yè)構建之前,都會已經存在若干的業(yè)務。來自這些系統(tǒng)的代表了企業(yè)目前的業(yè)務狀況。這些一般是高粒度的,即達到非常細節(jié)的程度(例如通信行業(yè)里面的詳細通話記錄等)。來自業(yè)務系統(tǒng)的實時數(shù)據(jù)是企業(yè)數(shù)據(jù)的最重要的數(shù)據(jù)來源,但是,在這些數(shù)據(jù)進入數(shù)據(jù)之前,必須經過抽取、轉換、加載等多個工序的處理。

典型的數(shù)據(jù)抽取接口包括數(shù)據(jù)庫接口和文件接口,對于不同的數(shù)據(jù)平臺、不同源數(shù)據(jù)形式、不同性能要求和業(yè)務量的源數(shù)據(jù)以及不同數(shù)據(jù)量的源數(shù)據(jù),采取不同的數(shù)據(jù)抽取接口。數(shù)據(jù)轉換是指從業(yè)務系統(tǒng)中抽取的源數(shù)據(jù)根據(jù)數(shù)據(jù)系統(tǒng)模型的要求,進行數(shù)據(jù)的轉換、清洗、合并、拆分、匯總等處理,保證來自不同系統(tǒng)、不同格式的數(shù)據(jù)的一致性和完整性。數(shù)據(jù)加載就是將從數(shù)據(jù)源系統(tǒng)中抽取轉換后的數(shù)據(jù)加載到數(shù)據(jù)倉庫系統(tǒng)中。數(shù)據(jù)加載策略要考慮加載周期以及數(shù)據(jù)追加策略方面的問題。

對于數(shù)據(jù)的抽取與轉換過程中發(fā)現(xiàn)的錯誤數(shù)據(jù),在加載到數(shù)據(jù)倉庫的同時,打上錯誤數(shù)據(jù)的標簽,并結邏輯上集中存放。

目前,通信行業(yè)已經建立起自己的BOSS(Business Operation Support System)系統(tǒng),對自身的計費系統(tǒng)和客戶服務系統(tǒng)等專業(yè)業(yè)務系統(tǒng)數(shù)據(jù)進行了整合。這就是主要的數(shù)據(jù)源。

分析數(shù)據(jù)處理的意義在于通過處理,一方面提高數(shù)據(jù)的質量;另一方面,使數(shù)據(jù)從適應業(yè)務系統(tǒng)(OLTP)的數(shù)據(jù)模式轉換為適應分析系統(tǒng)的數(shù)據(jù)模式。

5 經營分析系統(tǒng)中數(shù)據(jù)分析的實現(xiàn)

數(shù)據(jù)分析技術是建立在一定的數(shù)據(jù)基礎上的,進行分析的方法通常包括:OLAP分析、數(shù)據(jù)挖掘、統(tǒng)計分析、聯(lián)機挖掘(OLAM)等。需要說明的是,數(shù)據(jù)分析技術不一定要建立在數(shù)據(jù)倉庫基礎上,但有了數(shù)據(jù)倉庫,數(shù)據(jù)分析的效率和能力將大大提高。

移動經營分析系統(tǒng)分析部分的邏輯結構主要分三部分:服務器,其中包括網絡服務器與查詢服務器兩個模塊;以Client/Server方式的客戶端;以Web方式的客戶端。

網絡服務器可以讓客戶在網上查詢、集中管理客戶、報表的安全性和可適應得報表。查詢服務器按照預定時間自動進行查詢處理并通過E-mail、網絡、打印機和Web分發(fā)報表。

移動經營分析系統(tǒng)的主界面顯示的是近一季度全公司各種業(yè)務的業(yè)績水平。具體的分析主題可以通過主界面進行一些功能模塊選擇,主要分為長話流向分析,時段分析,消費水平分析3個功能模塊。

通過對各種角度的需求分析,總結分析內容的一般細化方法。主題的劃分實際上與分析內容的范圍直接相關,主題劃分清楚后,下一步就是細化分析以及根據(jù)分析內容的性質確定它在數(shù)據(jù)倉庫中的位置。通常維元素對應分析角度,而度量對應分析關心的具體指標,在數(shù)據(jù)倉庫中體現(xiàn)在話費數(shù)額,通話張數(shù),通話時長等方面。一個指標究竟是作為維元素、度量還是維屬性,取決于具體的業(yè)務需求,但從實際操作中可以總結出如下的概念性經驗:作為維元素或維屬性的通常是離散型的數(shù)據(jù),只允許有限的取值;作為度量的是連續(xù)型數(shù)據(jù),取值無限。如果一定要用連續(xù)型數(shù)據(jù)作為維元素,則必須對其按取值進行分段,以分段值作為實際的維元素,就像為了取消費水平為維元素,就對客戶群的消費水平進行分段。判斷分析指標是作為維元素還是維屬性時,則需綜合考慮這個指標占用的存儲空間與相關查詢的使用頻度。需要強調的是,在細化分析內容的過程中,務必解決指標的歧義問題。在不同報表中以及在業(yè)務訪談中同一名稱的指標,是不是在同樣條件限定下,通過同樣方法提取或計算得到的,它們之間的相互關系是什么,這些問題都必須從熟悉業(yè)務的分析人員那里得到準確、清晰的答案,否則將影響到模型設計、數(shù)據(jù)提取、數(shù)據(jù)展現(xiàn)等多個方面。

6 結語

本文分析和探討了在移動中建立基于數(shù)據(jù)倉庫的經營分析系統(tǒng)的若干問題,并進行了相關的設計。但討論尚不全面,需要在工作中繼續(xù)研究。

移動通信企業(yè)日益增多的信息數(shù)據(jù)無疑是一個巨大的聚寶盆,通過對數(shù)據(jù)的不斷分析研究,挖掘出更深層次的內容找出更多有價值的規(guī)律,需要企業(yè)各層面的人員共同協(xié)作、長期參與,而這給移動通信企業(yè)帶來的效益也將是源源不斷的。


上一頁 1 2 3 下一頁

評論


相關推薦

技術專區(qū)

關閉