一直覺得數據倉庫很遙遠
畢竟它對資源的要求很高
經濟
統計
計算機等綜合能力
數據倉庫是面向決策支持的應用
用於提供一個統一的視角
在過去對於不同的部門來說
對每個客戶的認識是片面的
也許客戶部門會認為一個總投訴的客戶肯定不是一個好客戶
但對於財務部門來說該客戶為公司創造了利潤
是個好客戶
對於市場部門來說
他還想交叉銷售一些其他服務
但實際上每個員工都只是了解他們的客戶的一部門
數據倉庫就是要把這些來自不同應用
不同系統的數據整理
組織到一起
集中
處理
形成一個全企業的single view
應該看到的是大量數據是數據倉庫的基礎
沒有大量的歷史和當前數據
那麼數據倉庫就是空談
但數據倉庫不是一個data storage
不是簡單地把各個業務系統的數據裝進去
而是需要很好的重新組織
形成一個良好的data model
任何一個成功的數據倉庫項目都要求對行業要有深刻的認識
才可能幫助客戶提煉需求
整理業務
規劃戰略
目前國內具備數據倉庫實施能力的非常少
原因就是沒有足夠的行業顧問咨詢能力
通常數據倉庫的數據要求完整
一致
相關性
原子化(不可分割)
因此進入數據倉庫的數據都要進行ETL
數據倉庫不是一個產品
而是一個不斷完善的過程
對於沒有真正接觸過的數據倉庫的大多數企業
他們很難理解這個
畢竟這與以往的系統有著太大的區別
簡單說來數據倉庫的建設是一個螺旋式上升的過程
曾經有位國外的數據倉庫專家認為數據倉庫的實施應該是階段性實施
把一個個大目標分割成數個小步驟
迅速地實現一個一個小目標
讓客戶盡快的體會實施帶來的好處
這將大大推動客戶的需求和主動性
曾經有人說數據倉庫很容易就做成一個報表系統
其實數據倉庫的實施有多個階段
最初實現報表功能
接著是分析功能
再次是預測功能
我覺得數據倉庫可以是一個不錯的報表系統
尤其是跨部門
跨業務的報表
這是相當具有吸引力的
而且對於初次使用數據倉庫的客戶這是最為直接的成果
但應該注意到
數據倉庫應該不斷向前發展
實現DSS的功能
這是數據倉庫實施廠商和客戶互動的結果
不能指望客戶與你站在一個高度
數據倉庫在國內剛起步
實施起來可參考
可借鑒的只有國外的案例
這在一定程度上不利於數據倉庫的
但誰在其中推動了市場的發展
誰就贏得了巨大的中國市場
國內可以做數據倉庫的只有很少幾個行業
主要是生產系統不完備
歷史數據有限
但就是這些行業也是一個很大的市場
數據集市是數據倉庫面向主題的商業視圖
它包含比數據倉庫少得多的數據量
通常數據倉庫是面向全企業的
而數據集市則是面向部門級的
數據集市是放在dw中
還是單獨拿出來
這要從多個角度考慮
費用
性能
用戶量
並發訪問量
如果有必要則可以把數據集市單獨拿出來
定期從數據倉庫中refresh
再說一下olap的問題
其實對於一些predined的業務問題
可以利用cube解決
首先是速度快
不必從dw/dm中重新組織數據
另外安全
數量眾多的ad hoc很容易把dw/dm拖垮
而對於一些臨時的動態的查詢
可以根據需要從數據集市/數據倉庫中執行
但這要求it部門的參與
並且通常有嚴格的訪問控制
From:http://tw.wingwit.com/Article/program/Oracle/201311/17524.html