空間數據挖掘系統一種新的實現方案
以上幾種系統都是用自己開發的或GIS軟件開發商提供的GIS平台組件或中間件來實現SDM系統中空間數據管理和分析本文中提出了空間數據挖掘系統一種新的實現方案即以現在通用空間數據庫(Oracle Spatial)為核心利用其空間數據管理和空間分析的能力完成空間數據挖掘中大量的空間信息抽取任務GIS組件只承擔對挖掘結果的地圖化顯示任務采用這種模式不僅可實現GIS系統與空間數據挖掘系統完全集成並且由於大部分空間信息抽取過程直接在低層數據庫上進行從而可大大提高計算效率
新的空間數據挖掘系統結構如圖所示該系統的基本結構與一般數據挖掘系統相同僅在數據挖掘和數據管理中增加了有關空間信息的抽取空間數據管理和空間分析的功能並建立了一個人機接口處理用戶的指令和顯示挖掘結果
這種開發模式與現存開發模式的最大區別是用通用空間數據庫代替專門的GIS商用軟件實現空間數據管理和空間分析功能它的優點如下
()GIS商用軟件一般是為開發GIS系統而設計的GIS作為一個獨立軟件系統時需要具有完整的功能結構而在為數據挖掘服務時其主要目的在於為決策者提供決策對象及顯示作為挖掘結果的地圖因此只要按需選取GIS的部分功能而不必面面俱到GIS的一些功能如空間數據的管理和空間分析等在通用空間數據庫系統中存在相似模塊因此可由通用空間數據庫管理系統中已有功能得到空間數據和屬性數據的查詢和空間操作可利用數據庫管理功能數據挖掘分析模塊則可作為一個或多個模塊由數據挖掘子系統統一管理而空間數據的存儲管理與分析均交給通用空間數據庫完成這樣不僅可減少系統的功能冗余提高系統的一致性還可更好地利用商用數據管理系統的各種優化技術來提高系統空間數據管理與分析的速度
()從異構數據庫的集成和空間數據與屬性數據的統一管理來看目前不同GIS廠商的遵循的空間數據格式標准不同GIS通用平台或組件一般只能直接處理本系統的空間數據文件因此異種數據庫的集成是一個難題而通用空間數據庫提供了數據轉換接口可以將各種不同格式的空間數據轉換為統一的格式存入擴展的對象——關系數據庫從而很好地解決了異種數據庫的集成的問題另外它還克服了GIS系統空間數據與屬性數據分離的缺點
()從數據挖掘與空間數據庫技術結合來看空間數據庫系統與數據挖掘系統完全分開的系統盡管簡單但有不少缺點首先空間數據庫系統在存儲組織訪問和處理數據立方體方面提供了很大的靈活性和有效性在空間數據庫(SDB)/空間數據倉庫(SDW)系統中數據多半被很好地組織索引清理集成或合並使得找出任務相關的高質量的數據成為一件容易的任務不使用SDB/SDW系統數據挖掘系統可能要花大量的時間查找收集清理和轉換數據其次在SDB或SDW系統中有許多被測試的可伸縮的算法和數據結構因此使用這種系統開發有效的可伸縮的實現是切實可行的此外大部分數據已經或將要存放在SDB/SDW系統中不與這些系統耦合數據挖掘系統就需要使用其它工具提取數據使得很難將這種系統集成到信息處理環境
()Oracle Spatial是專門為開發與執行大型企業空間數據倉庫而研制的產品它在海量空間數據的存儲和組織上性能卓越在開發基於空間數據倉庫的空間數據挖掘應用方面具有顯著的優勢
()Oracle Spatial分擔了SDM算法中部分空間數據抽取的任務減輕了數據挖掘子系統的負擔;另外由於Oracle對分布式應用的良好支持從而為實現分布式空間數據挖掘及並行空間數據挖掘提供了最佳方案
基於以上方案筆者實現了一個基於Oracle Spatial的分布式空間數據挖掘原型系統系統由五部分組成①圖形用戶界面用於進行交互式的挖掘並顯示挖掘結果;②數據准備模塊進行數據的選擇預處理和轉換;③挖掘模塊聚類分類關聯規則等空間數據挖掘功能及挖掘結果的評價;④空間數據管理模塊執行數據准備模塊及挖掘模塊指定的空間操作;⑤數據庫服務器管理作為挖掘目標的空間數據和非空間數據及概念層次庫挖掘結果庫挖掘目標的空間和非空間數據及概念層次的存儲和空間數據的管理由Oracle Spatial實現數據准備算法和聚類分類關聯規則等挖掘算法在服務器端實現並提供接口給客戶端在客戶端用GIS組件MapX實現挖掘結果的專題圖顯示其編程工具為VC++
[] []
From:http://tw.wingwit.com/Article/program/SQL/201311/16147.html