在數據挖掘技術日益發展的同時
許多數據挖掘的商業軟件工具也逐漸問世
數據挖掘工具主要有兩類
特定領域的數據挖掘工具和通用的數據挖掘工具
特定領域的數據挖掘工具針對某個特定領域的問題提供解決方案
在設計算法的時候
充分考慮到數據
需求的特殊性
並作了優化
對任何領域
都可以開發特定的數據挖掘工具
例如
IBM公司的AdvancedScout系統針對NBA的數據
幫助教練優化戰術組合
加州理工學院噴氣推進實驗室與天文科學家合作開發的SKICAT系統
幫助天文學家發現遙遠的類星體
芬蘭赫爾辛基大學計算機科學系開發的TASA
幫助預測網絡通信中的警報
特定領域的數據挖掘工具針對性比較強
只能用於一種應用
也正因為針對性強
往往采用特殊的算法
可以處理特殊的數據
實現特殊的目的
發現的知識可靠度也比較高
通用的數據挖掘工具不區分具體數據的含義
采用通用的挖掘算法
處理常見的數據類型
一般提供六種模式
例如
IBM公司Almaden研究中心開發的QUEST系統
SGI公司開發的MineSet系統
加拿大SimonFraser大學開發的DBMiner系統
通用的數據挖掘工具可以做多種模式的挖掘
挖掘什麼
用什麼來挖掘都由用戶根據自己的應用來選擇
下面簡單介紹幾種數據挖掘工具
QUEST
QUEST是IBM公司Almaden研究中心開發的一個多任務數據挖掘系統
目的是為新一代決策支持系統的應用開發提供高效的數據開采基本構件
系統具有如下特點
提供了專門在大型數據庫上進行各種開采的功能
關聯規則發現
序列模式發現
時間序列聚類
決策樹分類
遞增式主動開采等
各種開采算法具有近似線性(O(n))計算復雜度
可適用於任意大小的數據庫
算法具有找全性
即能將所有滿足指定類型的模式全部尋找出來
為各種發現功能設計了相應的並行算法
MineSet
MineSet是由SGI公司和美國Standford大學聯合開發的多任務數據挖掘系統
MineSet集成多種數據挖掘算法和可視化工具
幫助用戶直觀地
實時地發掘
理解大量數據背後的知識
MineSet有如下特點
MineSet以先進的可視化顯示方法聞名於世
提供多種 萃诰蚰J健0ǚ擲嗥鳌⒒毓槟J健⒐亓嬖颉⒕劾喙椤⑴卸狹兄匾取?br>
支持多種關系數據庫
可以直接從Oracle
Informix
Sybase的表讀取數據
也可以通過SQL命令執行查詢
多種數據轉換功能
在進行挖掘前
MineSet可以去除不必要的數據項
統計
集合
分組數據
轉換數據類型
構造表達式由已有數據項生成新的數據項
對數據采樣等
操作簡單
支持國際字符
可以直接發布到Web
DBMiner
DBMiner是加拿大SimonFraser大學開發的一個多任務數據挖掘系統
它的前身是DBLearn
該系統設計的目的是把關系數據庫和數據開采集成在一起
以面向屬性的多級概念為基礎發現各種知識
DBMiner系統具有如下特色
能完成多種知識的發現
泛化規則
特性規則
關聯規則
分類規則
演化知識
偏離知識等
綜合了多種數據開采技術
面向屬性的歸納
統計分析
逐級深化發現多級規則
元規則引導發現等方法
提出了一種交互式的類SQL語言——數據開采查詢語言DMQL
能與關系數據庫平滑集成
實現了基於客戶/服務器體系結構的Unix和PC(Windows/NT)版本的系統
From:http://tw.wingwit.com/Article/os/xtgl/201311/8966.html