熱點推薦:
您现在的位置: 電腦知識網 >> 操作系統 >> Windows系統管理 >> 正文

SAS數據倉庫的體系結構

2013-11-11 21:41:30  來源: Windows系統管理 

  數據倉庫的加載和更新
  
  從數據源抓取數據不僅有質量問題還存在有計劃地按一定時間節奏從數據源取出和 裝入更新數據倉庫的問題因為SAS系統有主動去取外部數據的能力所以按時間節奏 從數據源取出數據的操作在和其它系統管理人員協調好的基礎上就可完全在SAS系統內 制定從各系統取用數據的計劃了在此基礎上數據倉庫按照數據和信息使用的時間要求 准時地加載更新就是完全有保障的了
  
  從數據源到數據倉庫一氣呵成的集成式的操作這是SAS數據倉庫技術的重要特點
  
  按決策需要重組數據和信息清理好的數據還要進行重組按照決策的需要組織成不同主題的數據倉庫表這是十分關鍵性的操作在再小的企業或組織中也總是有許多業務和技術環節的一般來說原來運行系統數據庫的設計也總是針對這些業務和技術環節設置實體即數據庫的表這樣的設計使OLTP系統在線運行時發揮了最大限度的工作 效率但在開拓決策支持的OLAP時特別是對於全企業范圍的數據進行操作時這種數據 結構效率極低這是因為可能要從許多表中取出所需數據而且還要進行數據的篩選 對 不同表中的數據進行擬合等操作這是極費時間和資源的企業范圍的決策是對各個環節 分別進行業務處理的業務重組這就需要有相應數據結構的重組即按決策的需要組織成 不同主題的數據倉庫表以及相應的數據視圖匯總表等SAS為此設置了交互式操作的界 面以最大的主動性幫您完成決策支持所需的數據重組
  
  豐富的決策數據處理能力 為更有效地支持決策必須進行廣泛深入的數據挖掘( Data Mining)而不是僅僅提供簡單的函數功能供編程使用
  
  SAS在這方面有世界領先的豐富的決策支持數據分析處理軟件
  
  首先SAS/MDDB可幫您構造最適宜OLAP操作的多維數據結構
  
  SAS/STAT覆蓋了所有的實用數理統計分析方法是國際上統計分析領域的標准軟件它提供了十多個過程可進行各種不同模型或不同特點的回歸分析;為多種試驗設計模型提 供了方差分析工具;在多變量統計分析方面為主成分分析相關分析判別分析和因子分 析提供了許多專用過程;還包括多種聚類准則的聚類分析方法
  
  SAS/ETS提供了豐富的計量經濟學和時間序列分析方法是研究復雜系統和進行預測的有力工具
  
  SAS/OR提供了全面的運籌學方法
  
  SAS/IML提供了功能強大的面向矩陣運算的編程語言幫助您研究新算法或解決SAS系統中沒有現成算法的專門問題
  
  SAS/INSIGHT是一個可視化的數據探索工具它將統計方法與交互式圖形顯示融合在一起為您展現了一種全新的使用統計分析方法的環境
  
  還有SAS的人工神經元網絡和SAS/ASSIST……等具有很大伸縮性的適合各個層次 各種類型人員使用的工具
  
  靈活多樣的結果展現方式 分析結果的展現方式對決策時人的判別有重大的影響SAS也有眾多的方式方法供您選擇:
  
  在Base SAS中就有從簡單列表到比較復雜的統計報表和用戶自定義的式樣復雜的報表的能力
  
  SAS/ER(Enterprise Report)更是為企業級的決策過程提供了報告的制作能力
  
  SAS/GRAPH是一個強有力的圖形軟件包可將數據及其包含著的深層信息以多種圖形生動的呈現出來……
  
  從各種數據源主動地取出數據;經過清理整合;再按決策支持的需要分主題重組數據;按照時序節奏不斷地自動裝載更新數據倉庫;用世界權威的豐富的數據處理工具 進行決策分析;最後以多種形式將決策支持的意見呈現給您這就是完整的決策支持數據 倉庫解決方案!
  
  提醒您:在購買數據倉庫產品時必須注意您所得到的產品是否能夠實現決策支持所需的全部技術環節!
  
  SAS數據倉庫的體系結構
  
  數據庫技術大大推動了計算機應用的迅速發展特別是建立在EFCodd提出的ER理 論基礎上的關系型數據庫更是為OLTP(聯機事務處理)應用開拓了廣闊天地年EF Codd曾回答一個提問:為什麼在對一個運行良好的基於ER理論的關系數據庫進行查詢 以制作一個較大的報告時系統的響應速度特別的慢他說:運行數據庫是為OLTP需求環 境設計的這已有太多的成功事例但現在我們所面對的是OLAP(聯機分析處理這個概念 述語EFCodd在此第一次提出)類型的需求要實現OLAP就要有適應它的整合的快速 的多維的信息架構和查詢機制
  
  SAS數據倉庫就是一個適應於對企業級的數據信息進行重新整合適應多維快速查詢;進行OLAP操作和決策支持的數據信息的采集管理處理和展現的架構體系可 用右圖表示:
  
  環境(Enviroment) 環境是SAS數據倉庫體系結構的總根它由兩大部分組成一部分 是分別含有不同主題內容的若干個數據倉庫;另一部分是對數據源的定義這構成了從數 據采集到直接應用完整的支持體系
  
  數據倉庫(Data Warehouse) 為了使用上的方便可以存在多個數據倉庫在一個大的企業或組織中不同部門在進行決策分析時可能使用徊然不同的數據重新整合後就沒 有必要將它們放在一起了在體系結構層次中的數據倉庫主要是管理性的作用其中有對 數據倉庫所有組成單元的解釋性數據Metadata在每個數據倉庫中還可以設置若干個主 題這一般是同一部門中支持不同決策內容的數據主題是較大的數據載體相對精簡或 匯總一些的是所謂數據市場在一個數據倉庫中亦可存在若干個數據市場
  
  主題(Subject) 在每個主題中有一個主題表系統放置與此主題相關的各種數據為 了支持決策還設置了若干個數據的匯總表組進一步還有若干個信息市場組其中放置 的是對數據處理後產生的決策支持信息
  
  主題表系統(Detail) 這裡放置的就是從各個數據源中取出經過清理整合的原始數據為了使用和管理的方便這些數據可放在多個表中
  
  主題表(Detail Table) 從運行系統數據源取出的數據分別組成這裡的若干表它 們可能是實際的表也可以是一些邏輯視圖(View)從本質上講它們和原來各個運行系 統數據源的數據內容是一致的但是為了方便地支持決策數據處理而對數據的結構進行 了重組為了決策支持數據處理工作的方便和提高工作的效率在數據重組過程中可能 還要增加一些數據冗余
  
  匯總表組(Summary Groups) 在匯總表組中定義進行數據匯總處理時的層次維數和所 分析的變量當匯總表組是按SAS數據集和DBMS格式存放時可有六個層次若是采用SA S 的多維數據庫產品MDDB時則可有任意多個層次實際上數據匯總就是最常用的決策支持

From:http://tw.wingwit.com/Article/os/xtgl/201311/8995.html
    推薦文章
    Copyright © 2005-2013 電腦知識網 Computer Knowledge   All rights reserved.