第二步按照業務邏輯的規則對數據進行歸並
把ODS中不同主題中的表示相同業務的數據(來自不同的業務系統)進行歸並例如一般企業的客服系統(Call Center)都受理一部分業務而這些業務受理與在營業廳或銷售店的受理是一樣的因此這類數據要歸並到一起
第三步把包含細節過多的交易記錄進行拆分
事實上一個交易記錄所包含的信息內容非常豐富往往超越了某個人或部門的分析需求但不同的人有不同的關注點因此為提高性能起見我們需要把一個長記錄包含的信息進行分析分解匯總例如在電信企業中經過二次批價後的通話詳單包含多種信息經過分析它包括網絡信息業務類型信息時間信息地理信息費用信息這樣幾個類別的信息而每一類信息都由幾個字段來進行記錄這些不同類別的信息是很少有人都同時關心的一般來說網管部門關心網絡信息市場部門關心業務類型信息而時間信息和地理信息恰是所有部門都需要的按照這樣的情況我們把一條話單按照信息內容進行拆分拆分後進行匯總歸並以支持不同部門的分析要求當然對於數據挖掘應用可能同時關心所有的信息以發掘不同信息之間的關系但這種情況一則很少二則真正的數據挖掘更多的時候依賴於交易細節數據也就是說對於專題問題的研究可以從ODS中進行數據的再次處理
第四步匯總再匯總
匯總的問題決不僅僅是為了提高性能而做的事情(當然匯總能夠有效提高性能)但匯總同時意味著更高程度的綜合在這個過程中我們會發現與ODS系統設計過程相反我們從細節走向了宏觀在ODS中我們初步確定了企業信息模型對企業信息模型進行初步分解再分解再分解得到了一個個的主題;在數據倉庫中我們從一個個的主題開始綜合再綜合我們沿著與ODS相反的方向走向了企業的宏觀數據視圖事實上在DW設計中匯總綜合的終極目標是要在最後把多個主題匯總成為一個大的主題而這個主題所包含的維度和度量就是這個企業運行的命脈指標是企業老板所最為關注的那幾個指標
[] [] [] [] [] [] []
From:http://tw.wingwit.com/Article/program/SQL/201311/16260.html