熱點推薦:
您现在的位置: 電腦知識網 >> 編程 >> SQL語言 >> 正文

深入探討數據倉庫建模與ETL的實踐技巧[4]

2013-11-13 12:37:55  來源: SQL語言 

  緩慢變化維度第三種類型

  新增數據維度成員改變了屬性例如某一維度成員新加入了一列該列在歷史數據中不能基於它浏覽而在目前數據和將來數據中可以按照它浏覽那麼此時我們需要改變維度表屬性即加入新的字段列那麼我們將使用存儲過程或程序生成新的維度屬性在後續的數據中將基於新的屬性進行查看

  (五)創建事實表

  在確定好事實數據和維度後我們將考慮加載事實表

  在公司的大量數據堆積如山時我們想看看裡面究竟是什麼結果發現裡面是一筆筆生產記錄一筆筆交易記錄… 那麼這些記錄是我們將要建立的事實表的原始數據即關於某一主題的事實記錄表

  我們的做法是將原始表與維度表進行關聯生成事實表(圖六picbmp)注意在關聯時有為空的數據時(數據源髒)需要使用外連接連接後我們將各維度的代理鍵取出放於事實表中事實表除了各維度代理鍵外還有各量度數據這將來自原始表事實表中將存在維度代理鍵和各量度而不應該存在描述性信息即符合瘦高原則即要求事實表數據條數盡量多(粒度最小)而描述性信息盡量少

  如果考慮到擴展可以將事實表加一唯一標識列以為了以後擴展將該事實作為雪花型維度不過不需要時一般建議不用這樣做

  事實數據表是數據倉庫的核心需要精心維護在JOIN後將得到事實數據表一般記錄條數都比較大我們需要為其設置復合主鍵和索引以實現數據的完整性和基於數據倉庫的查詢性能優化事實數據表與維度表一起放於數據倉庫中如果前端需要連接數據倉庫進行查詢我們還需要建立一些相關的中間匯總表或物化視圖以方便查詢

  什麼是ETL

  在數據倉庫的構建中ETL貫穿於項目始終它是整個數據倉庫的生命線包括了數據清洗整合轉換加載等各個過程如果說數據倉庫是一座大廈那麼ETL就是大廈的根基ETL抽取整合數據的好壞直接影響到最終的結果展現所以ETL在整個數據倉庫項目中起著十分關鍵的作用必須擺到十分重要的位置

[]  []  []  []  []  []  


From:http://tw.wingwit.com/Article/program/SQL/201311/16277.html
    推薦文章
    Copyright © 2005-2013 電腦知識網 Computer Knowledge   All rights reserved.