熱點推薦:
您现在的位置: 電腦知識網 >> 編程 >> SQL語言 >> 正文

深入探討數據倉庫建模與ETL的實踐技巧[2]

2013-11-13 12:37:54  來源: SQL語言 

  (二)確定量度

  在確定了主題以後我們將考慮要分析的技術指標諸如年銷售額之類它們一般為數值型數據我們或者將該數據匯總或者將該數據取次數獨立次數或取最大最小值等這樣的數據稱為量度

  量度是要統計的指標必須事先選擇恰當基於不同的量度可以進行復雜關鍵性能指標(KPI)等的設計和計算

  (三)確定事實數據粒度

  在確定了量度之後我們要考慮到該量度的匯總情況和不同維度下量度的聚合情況考慮到量度的聚合程度不同我們將采用最小粒度原則即將量度的粒度設置到最小

  例如假設目前的數據最小記錄到秒即數據庫中記錄了每一秒的交易額那麼如果我們可以確認在將來的分析需求中時間只需要精確到天就可以的話我們就可以在ETL處理過程中按天來匯總數據此時數據倉庫中量度的粒度就是;反過來如果我們不能確認將來的分析需求在時間上是否需要精確到秒那麼我們就需要遵循最小粒度原則在數據倉庫的事實表中保留每一秒的數據以便日後對進行分析

  在采用最小粒度原則的同時我們不必擔心海量數據所帶來的匯總分析效率問題因為在後續建立多維分析模型(CUBE)的時候我們會對數據提前進行匯總從而保障產生分析結果的效率關於建立多維分析模型(CUBE)的相關問題我們將在下期欄目中予以闡述

  (四)確定維度

  維度是指分析的各個角度例如我們希望按照時間或者按照地區或者按照產品進行分析那麼這裡的時間地區產品就是相應的維度基於不同的維度我們可以看到各量度的匯總情況也可以基於所有的維度進行交叉分析

[]  []  []  []  []  []  


From:http://tw.wingwit.com/Article/program/SQL/201311/16275.html
    推薦文章
    Copyright © 2005-2013 電腦知識網 Computer Knowledge   All rights reserved.