這篇論壇文章(賽迪網技術社區)深入探討了搭建數據倉庫過程中應當遵循的方法和原則更多內容請參考下文
一數據倉庫的架構
數據倉庫(Data Warehouse \ DW)是為了便於多維分析和多角度展現而將數據按特定的模式進行存儲所建立起來的關系型數據庫它的數據基於OLTP源系統數據倉庫中的數據是細節的集成的面向主題的以OLAP系統的分析需求為目的
數據倉庫的架構模型包括了星型架構(圖二picbmp)與雪花型架構(圖三picbmp)兩種模式如圖所示星型架構的中間為事實表四周為維度表類似星星;而相比較而言雪花型架構的中間為事實表兩邊的維度表可以再有其關聯子表從而表達了清晰的維度層次關系
從OLAP系統的分析需求和ETL的處理效率兩方面來考慮星型結構聚合快分析效率高;而雪花型結構明確便於與OLTP系統交互因此在實際項目中我們將綜合運用星型架構與雪花型架構來設計數據倉庫
那麼下面我們就來看一看構建企業級數據倉庫的流程
二構建企業級數據倉庫五步法
(一)確定主題
即確定數據分析或前端展現的主題例如我們希望分析某年某月某一地區的啤酒銷售情況這就是一個主題主題要體現出某一方面的各分析角度(維度)和統計數值型數據(量度)之間的關系確定主題時要綜合考慮
我們可以形象的將一個主題想象為一顆星星統計數值型數據(量度)存在於星星中間的事實表;分析角度(維度)是星星的各個角;我們將通過維度的組合來考察量度那麼某年某月某一地區的啤酒銷售情況這樣一個主題就要求我們通過時間和地區兩個維度的組合來考察銷售情況這個量度從而不同的主題來源於數據倉庫中的不同子集我們可以稱之為數據集市數據集市體現了數據倉庫某一方面的信息多個數據集市構成了數據倉庫
[] [] [] [] [] []
From:http://tw.wingwit.com/Article/program/SQL/201311/16274.html