數據倉庫的加載和更新
從數據源抓取數據不僅有質量問題
還存在有計劃地按一定時間節奏從數據源取出和 裝入
更新數據倉庫的問題
因為SAS系統有主動去取外部數據的能力
所以按時間節奏 從數據源取出數據的操作在和其它系統管理人員協調好的基礎上
就可完全在SAS系統內 制定從各系統取用數據的計劃了
在此基礎上
數據倉庫按照數據和信息使用的時間要求
准時地加載
更新
就是完全有保障的了
從數據源到數據倉庫一氣呵成的集成式的操作
這是SAS數據倉庫技術的重要特點
按決策需要重組數據和信息清理好的數據還要進行重組
按照決策的需要組織成不同主題的數據倉庫表
這是十分關鍵性的操作
在再小的企業或組織中
也總是有許多業務和技術環節的
一般來說
原來運行系統數據庫的設計也總是針對這些業務和技術環節設置
實體
即數據庫的表
這樣的設計使OLTP系統在線運行時
發揮了最大限度的工作 效率
但在開拓決策支持的OLAP時
特別是對於全企業范圍的數據進行操作時
這種數據 結構效率極低
這是因為可能要從許多表中取出所需數據
而且還要進行數據的篩選
對 不同表中的數據進行擬合等操作
這是極費時間和資源的
企業范圍的決策是對各個環節 分別進行業務處理的業務重組
這就需要有相應數據結構的重組
即按決策的需要組織成 不同主題的數據倉庫表
以及相應的數據視圖
匯總表等
SAS為此設置了交互式操作的界 面
以最大的主動性幫您完成決策支持所需的數據重組
豐富的決策數據處理能力 為更有效地支持決策
必須進行廣泛
深入的數據挖掘( Data Mining)
而不是僅僅提供簡單的函數功能供編程使用
SAS在這方面有世界領先的豐富的決策支持數據分析
處理軟件
首先SAS/MDDB可幫您構造最適宜OLAP操作的多維數據結構
SAS/STAT覆蓋了所有的實用數理統計分析方法
是國際上統計分析領域的標准軟件
它提供了十多個過程可進行各種不同模型或不同特點的回歸分析;為多種試驗設計模型提 供了方差分析工具;在多變量統計分析方面
為主成分分析
相關分析
判別分析和因子分 析提供了許多專用過程;還包括多種聚類准則的聚類分析方法
等
SAS/ETS提供了豐富的計量經濟學和時間序列分析方法
是研究復雜系統和進行預測的有力工具
SAS/OR提供了全面的運籌學方法
SAS/IML提供了功能強大的面向矩陣運算的編程語言
幫助您研究新算法或解決SAS系統中沒有現成算法的專門問題
SAS/INSIGHT是一個可視化的數據探索工具
它將統計方法與交互式圖形顯示融合在一起
為您展現了一種全新的使用統計分析方法的環境
還有SAS的人工神經元網絡和SAS/ASSIST……等
具有很大伸縮性的
適合各個層次
各種類型人員使用的工具
靈活多樣的結果展現方式 分析結果的展現方式對決策時人的判別有重大的影響
SAS也有眾多的方式
方法供您選擇:
在Base SAS中就有從簡單列表到比較復雜的統計報表和用戶自定義的式樣復雜的報表的能力
SAS/ER(Enterprise Report)更是為企業級的決策過程提供了報告的制作能力
SAS/GRAPH是一個強有力的圖形軟件包
可將數據及其包含著的深層信息以多種圖形生動的呈現出來……
從各種數據源主動地取出數據;經過清理
整合;再按決策支持的需要分主題
重組數據;按照時序節奏不斷地自動裝載
更新數據倉庫;用世界權威的
豐富的數據處理工具 進行決策分析;最後以多種形式將決策支持的意見呈現給您
這就是完整的決策支持數據 倉庫解決方案!
提醒您:在購買數據倉庫產品時必須注意
您所得到的產品是否能夠實現決策支持所需的全部技術環節!
SAS數據倉庫的體系結構
數據庫技術大大推動了計算機應用的迅速發展
特別是建立在E
F
Codd提出的E
R理 論基礎上的關系型數據庫更是為OLTP(聯機事務處理)應用開拓了廣闊天地
年E
F
Codd曾回答一個提問:為什麼在對一個運行良好的
基於E
R理論的關系數據庫進行查詢 以制作一個較大的報告時
系統的響應速度特別的慢
他說:運行數據庫是為OLTP需求環 境設計的
這已有太多的成功事例
但現在我們所面對的是OLAP(聯機分析處理
這個概念 述語E
F
Codd在此第一次提出)類型的需求
要實現OLAP就要有適應它的
整合的
快速 的
多維的信息架構和查詢機制
SAS數據倉庫就是一個適應於對企業級的數據
信息進行重新整合
適應多維
快速查詢;進行OLAP操作和決策支持的數據
信息的采集
管理
處理和展現的架構體系
可 用右圖表示:
環境(Enviroment) 環境是SAS數據倉庫體系結構的總根
它由兩大部分組成
一部分 是分別含有不同主題內容的若干個數據倉庫;另一部分是對數據源的定義
這構成了從數 據采集到直接應用完整的支持體系
數據倉庫(Data Warehouse) 為了使用上的方便
可以存在多個數據倉庫
在一個大的企業或組織中
不同部門在進行決策分析時可能使用徊然不同的數據
重新整合後就沒 有必要將它們放在一起了
在體系結構層次中的數據倉庫主要是管理性的作用
其中有對 數據倉庫所有組成單元的解釋性數據
Metadata
在每個數據倉庫中還可以設置若干個主 題
這一般是同一部門中支持不同決策內容的數據
主題是較大的數據載體
相對精簡或 匯總一些的是所謂數據市場
在一個數據倉庫中亦可存在若干個數據市場
主題(Subject) 在每個主題中有一個主題表系統
放置與此主題相關的各種數據
為 了支持決策
還設置了若干個數據的匯總表組
進一步還有若干個信息市場組
其中放置 的是對數據處理後產生的決策支持信息
主題表系統(Detail) 這裡放置的就是從各個數據源中取出
經過清理
整合的原始數據
為了使用和管理的方便
這些數據可放在多個表中
主題表(Detail Table) 從運行系統數據源取出的數據
分別組成這裡的若干表
它 們可能是實際的表
也可以是一些邏輯視圖(View)
從本質上講
它們和原來各個運行系 統數據源的數據內容是一致的
但是為了方便地支持決策數據處理
而對數據的結構進行 了重組
為了決策支持數據處理工作的方便和提高工作的效率
在數據重組過程中
可能 還要增加一些數據冗余
匯總表組(Summary Groups) 在匯總表組中定義進行數據匯總處理時的層次維數和所 分析的變量
當匯總表組是按SAS數據集和DBMS格式存放時可有六個層次
若是采用SA S 的多維數據庫產品MDDB時則可有任意多個層次
實際上數據匯總就是最常用的決策支持
From:http://tw.wingwit.com/Article/os/xtgl/201311/8995.html