你也許無法相信未來數據管理產品的功能
因此讓我們從目前數據庫的一些新特性著手
一位年輕人因患某種相對罕見的流感而到醫院就診
這是檢查醫師本周遇到的第三個相似的病例
他需要更多的信息
困惑不解的醫師取了血樣並安排了其他一些程序
然後
他坐在計算機前面
(通過一個簡單的圖形用戶界面)申請了一系列血樣分析項目
並將結果與世界各地具有相似症狀的患者進行比較
他還請求檢索與該年輕人情況相似的患者的診斷
治療和結果記錄
然後
醫師向疾病控制與預防中心(CDC)請求獲得該病症發展的相關信息
幾分鐘後
醫師就為其他患者找到了這種不尋常流感的治療方法
該流感近期在污染程度較為嚴重的一些城市流行
這種情景能在今日成為可能嗎?有可能(假如我們已擁有正確的科學分析和仿真工具包)
但要為此支付高級應用發展和系統配置所需的費用
數據管理早已發生變革以使類似情景切實可行
系統在更快
集成度更高
更易使用的同時增強功能
可擴展性和分布性
本文中
我將介紹數據管理行業今後幾年醞釀的產品以及推進DB
優先發展的動力
復雜因素 當今的公司正面臨不斷增加的數據管理工作的挑戰
越來越多的商務程序實現了自動化
更多的歷史記錄和分析工作被捕獲並保存下來
新的規章制度正在改變商業模式
簡言之
數據量在不斷增加
用於處理孤立程序的專用系統必須連接起來以生成報表
例如
兼並和收購迫使商務程序(風險分析)和數據(客戶信息)進行集成
不同的商業單位必須共享信息以獲得新的收入增長點
而公司也必須與商業伙伴
供應商和客戶交流信息
全球商務意味著管理分布式數據庫並提供全天候的可用性
成本居高不下
經濟停滯
競爭壓力增加迫使企業提高運行效率
這通常意味著員工數量減少
同時管理的數據維護及訪問任務的復雜性日益增加
當數據管理所帶來的挑戰日益增加時
信息的重要性就被提升到前所未有的高度
各種形式的信息——數據庫
電子數據表
文檔管理系統
文本文件
網頁
圖表和圖像——就成為企業共同的財富
因此
對數據庫和其他各種來源的數據進行管理的需求
以及為非IT專家的商業用戶提供更便捷的方式訪問這些數據的需求都在日益增加
更好的引擎 更多的數據需要存儲
更多的業務需要處理
更多的分析需要完成
而且沒有喘息時間
這些都期待著所有的數據管理要素繼續改進
載入和檢索速度
研究具有更快的載入和檢索速度的存儲方法仍將打頭陣
快速數據訪問研究包括新型索引(例如
能夠迅速適應新數據類型的通用索引結構)
采用多維聚簇加速訪問多維數據
該技術已在 DB
Universal Database (UDB) v
中應用並將在後續的版本中繼續使用
IBM 不斷研發不同的存儲方案以增加數據聚簇速度並加強對大對象的控制能力
對大量數據的高效查詢
解決海量業務數據高效處理和復雜查詢的工作也正在進行中
例如
IBM Almaden 研究中心開發了一種新方法
它通過采樣獲得數據的隨機子集並根據該樣本估計或外推解答
使系統能夠更快地為復雜查詢提供近似解答
該技術已應用在DB
UDB v
測試基礎版中
采樣將以更快的速度獲得更好的統計信息
幫助優化和不同的設計顧問
此外
為提高帶有大量子查詢和復雜操作內容(例如和外部關聯和反關聯)的查詢性能所做的相關改進工作也在進行中
有望在某些類型的查詢上取得重大飛躍
用以儲存針對高頻次查詢的預先計算解答的具體化查詢列表(MQT)可能被更廣泛地采納
目前 MQT 已經可用
並且正在擴展以儲存更多的一般性查詢解答
例如
DB
v
能夠儲存關聯結果
即使查詢中並無集合體
查詢引擎能夠更好地自主決定何時使用 MQT 解答當前查詢
用於提示系統何時創建 MQT 可能奏效的工具已出現
將來
數據庫系統能夠自主創建 MQT
並用於索引(如關聯檢索)和常用結果緩存中
當用於連接遠程數據時(v
已采用)
MQT 將發揮更大的作用
在大共享內存和非共享多處理器中
你將獲得更多的分割數據(分區)選擇和處理查詢的新算法
提高可用性
業務壓力要求適應更多環境的高可用性
熱備用系統瞬時切換已成為高端配置的標准
並將更為普及
總之
用戶可以從一系列的
服務質量
承諾中選擇在性能
可用性以及費用之間所需的權衡
同時
通過使用減少冗余硬件和備份信息
研究和開發人員將使那些權衡更容易實現
IBM 還在研究對存在的問題進行早期探測和自動更正
分布式商務模型 關於電子商務的需要已有很多著述
如今
越來越多的公司使用Web服務器
應用
J
EE
NET 和 XML 的復雜混合體在網上從事商務活動
在該環境內外獲取數據通常需要通過諸如 JDBC 這樣的接口實現數據訪問
並將結果轉換為 XML
然後將 XML 打包作為Web服務響應
目前
可以這種方式轉移數據
但這確實有些令人乏味
將來
數據庫會被更加直接地植入Web
使其成為Web應用基礎架構的無縫元件
數據管理和Web服務
數據庫早已成為Web服務供應商
通過Web服務接口應答請求
不久它也將成為Web服務的消費者
也就是說
在查詢過程中
它能夠調用Web服務以返回所需信息
例如
在一次單步查詢中
用戶可以查找一個包含本地儲存狀況描述
首選供應商(從不同的本地列表)
可用性及價格信息的零件(通過Web服務發出向供應商的請求並返回當前信息)
DB
早已顯示出這種能力
目前
你不得不通過用戶定義的函數在 SQL 語句中明確地調用Web服務
照此發展
你甚至可以將Web服務視為列表的別名從而能夠透明地訪問
應用開發和部署工具將隨技術而發展
XML支持
數據及處理集成的基礎即是對 XML 的穩定性支持
包括支持 XML 作為基本的數據類型
XML Extender 允許用戶保存和檢索 XML數據
通過它DB
能夠支持 XML
將來
IBM 會在引擎中引入更多的這種支持以優化訪問
目前
通過對SQL 語言(SQL/XML) 的標准化擴展
可以將關系數據以 XML 文件的形式返回
由此
可將數據以電子商務業務中數據交換所需的類型返回
所交換的文檔可在 RDBMS 中安全儲存
雙語數據庫
盡管 XML 顯然將成為電子商務數據交換的標准
關系數據庫並不會從此消失
僅支持 XML 的數據庫並不能代替無處不在的關系系統
一部分原因是將全部數據進行轉換所需的費用
另一部分原因是比 XML 數據庫更為成熟的關系技術的出現
相反
未來的數據庫能夠為 XML 提供全面的關系能力和真正的本地支持
它們將在引擎中構建支持 XML 的存儲管理和檢索工具
而且既可使用 XML 語言查詢即XQuery 又可使用 SQL
這種雙語數據庫可使用戶按需要同時利用關系和 XML 的優勢
以實施其最佳應用
IBM Xperanto 團隊正在從事此項工作
分布式數據信息集成 你已經了解到 XML 和 Web 服務是如何幫助你處理復雜的分布式商務模型
它們提供了一種分布式數據的集成方法
在不同的應用或企業之間交換數據
不過
有時卻需要更為精細的數據集成
如今的企業通常是高度分布的
某個職能部門可能分散於好幾個地點
某大型制藥公司可能在幾個不同國家都有研究實驗室
實驗室裡的科學家們則需要共享實驗和仿真信息
IBM 的數據管理開發團隊就分布在四個國家的七個地點
並在世界各地其他一些地方也有相關的研究機構
開發者需要在這些不同工作地點之間共享所需的技術規范
代碼
狀態和信息
獨立的機構會選擇不同的基礎架構
在某些盛行兼並和收購的行業裡
功能相同的部門卻擁有完全不同的 IT 基礎架構
這並不少見
業務運轉通常仍需在這些不同的地區和系統間共享信息
信息集成有多種機制包括 基於應用的集成
最常用的信息集成方法可能是
通過使用專門的應用實現對感興趣的資源的硬連接訪問
然後手動合並查詢結果
應用集成框架
業務流程集成工作流程系統以及Web服務都為程序員提供高級提取服務
使其能夠方便地從額外的來源獲取數據
當然
合並數據(即執行關聯)仍需手動編程
集中化的數據倉庫對於那些需要復雜分析的應用
許多公司選擇將需要的數據
拉入
(從數據來源處復制)單獨的數據倉庫(數據中心)
這樣做可以使SQL
全身心
地投入到分析中
並且也無需通過應用處理分散的數據
數據聯合造就虛擬數據庫並不是所有的數據都能進入數據倉庫
有時數據變化太快
有時該數據不為本企業所有(如歸其商業伙伴或某一信息服務機構所有)
有時該數據的格式不對
不能存貯到關系型數據庫系統中或被其搜索到
這時 DB
數據倉庫和數據中心就可大顯其道
IBM 傑出的技術可將那些各自為政的異構型分布數據源聯合起來
數據聯合讓用戶查詢分布式數據時更為簡便
就好像這些數據存貯在單一數據庫中
同時應用也變得更簡易並且擁有單一數據庫的功能
而無需復制與維護成本
通過數據聯合
應用可將底層數據存放到查詢中
使這些功能不被再次執行(如果數據實際移動
這些功能會執行)
數據聯合在客戶機應用與數據之間增加了一個部件——層
這個特殊的層使得性能達到平衡
在查詢過程中
數據存貯在不同點(沒有合並)將可能產生網絡延遲
借超級優化功能之東風
數據聯合使得多種應用間的數據集成更為高效簡捷
未來各種模型的融合信息集成很有可能成為大多數公司追逐的熱點
你也許可以看見不同的技術成熟並且融合
某一特定集成問題的解決方案將涉及到數據倉庫(用於可以存貯於關系型系統的關鍵數據)與數據聯合(用於集成不適合數據倉庫的數據)之間的集成
豐富的元數據設施簡化了從不同的數據源中映射
清除數據
同時簡化了將數據關聯在一起的過程
From:http://tw.wingwit.com/Article/program/Oracle/201311/18553.html