熱點推薦:
您现在的位置: 電腦知識網 >> 編程 >> Oracle >> 正文

數據挖掘概述(二)

2013-11-13 15:36:10  來源: Oracle 

  數據挖掘工具是怎樣准確地告訴你那些隱藏在數據庫深處的重要信息的呢?它們又是如何作出預測的?答案就是建模建模實際上就是在你知道結果的情況下建立起一種模型並且把這種模型應用到你所不知道的那種情況中比如說如果你想要在大海上去尋找一艘古老的西班牙沉船也許你首先想到的就是去找找過去發現這些寶藏的時間和地點有哪些那麼經過調查你發現這些沉船大部分都是在百慕大海區被發現並且那個海區有著某種特征的洋流以及那個時代的航線也有一定的特征可尋在這眾多的類似特征中你將它們抽象並概括為一個普適的模型利用這個模型你就很有希望在具有大量相同特征的另外一個地點發現一件不為人知的寶藏
   當然在數據挖掘技術甚至計算機出現以前這種建模抽象的方法就已經廣泛地被人們所使用在計算機中的建模和以前的建模方法並無很大不同主要的差異在於計算機能處理的信息量比起以前來更加龐大計算機中能夠存儲已知了結果的大量不同情況然後由數據挖掘工具從這些大量的信息裡面披沙揀金將能夠產生模型的信息提取出來一當模型建立好了之後就可以應用在那些情形相似但結果尚未知的判斷中了比如現在假設你是一個電信公司的營銷主任公司想發展一些新的長途電話用戶那麼你是不是會漫無目的地到街上去散發廣告呢?——就象漫無目的地在海上去尋寶一樣其實比起漫無目的地去進行宣傳來利用你以前的商業經驗來有目的地去拉攏客戶會產生高得多的效率
   作為一個營銷主任你對客戶的很多信息都可以了解得一清二楚年齡性別信用記錄以及長途電話使用狀況從好的一方面來看掌握了這些客戶的信息其實就是掌握了很多潛在的用戶的同樣的信息問題在於你還不一定了解他們的長途電話使用情況(因為他們的長途電話也許是通過的另一個電信公司)現在你的主要精力就集中在用戶中誰有比較多的長途電話上通過下面這個表格我們可以從數據庫裡面抽象某些變量建立起一個可以對此進行分類營銷的模型
    客戶 潛力
  一般信息
  (eg demographic data) 已知 已知
  私有信息
  (eg customer transactions) 已知 待定
  數據挖掘應用於分類營銷
   根據我們創建的從一般信息到私有信息的計算模型我們可以得出表二右下方表格中的信息比如一個電信公司的簡化模型可以是年薪萬美圓以上的%的客戶每個月長話費美圓以上根據這個模型我們就能應用這些數據來推斷出公司現在尚不能明確的私有信息這樣新客戶群體就可以大體確定出來了小型市場的試銷數據對於這樣的模型來說顯得極為有用因為小范圍內試銷數據的挖掘能夠為全部市場的分類銷售打下一個良好的基礎表三則描述了另外一樣數據挖掘的普遍應用預測 
   過去 現在 將來
  靜態信息和當前計劃 已知 已知 已知
  動態信息 已知 已知 待定
  數據挖掘應用於預測
  數據挖掘的體系結構
   現有很多數據挖掘工具是獨立於數據倉庫以外的它們需要獨立地輸入輸出數據以及進行相對獨立的數據分析
  了最大限度地發揮數據挖掘工具的潛力它們必須象很多商業分析軟件一樣緊密地和數據倉庫集成起來這樣在人們
  對參數和分析深度進行變化的時候高集成度就能大大地簡化數據挖掘過程
  集成後的數據挖掘體系
   應用數據挖掘技術較為理想的起點就是從一個數據倉庫開始這個數據倉庫裡面應保存著所有客戶的合同信息並且還應有相應的市場競爭對手的相關數據這樣的數據庫可以是各種市場上的數據庫SybaseOracleRedbrick和其他等等並且可以針對其中的數據進行速度上和靈活性上的優化
   聯機分析系統OLAP服務器可以使一個十分復雜的最終用戶商業模型應用於數據倉庫中數據庫的多維結構可以讓用戶從不同角度——比如產品分類地域分類或者其他關鍵角度——來分析和觀察他們的生意運營狀況數據挖掘服務器在這種情況下必須和聯機分析服務器以及數據倉庫緊密地集成起來這樣就可以直接跟蹤數據和並輔助用戶快速作出商業決策並且用戶還可以在更新數據的時候不斷發現更好的行為模式並將其運用於未來的決策當中
   數據挖掘系統的出現代表著常規決策支持系統的基礎結構的轉變不象查詢和報表語言僅僅是將數據查詢結果反饋給最終用戶那樣數據挖掘高級分析服務器把用戶的商業模型直接應用於其數據倉庫之上並且反饋給用戶一個相關信息的分析結果這個結果是一個經過分析和抽象的動態視圖層通常會根據用戶的不同需求而變化基於這個視圖各種報表工具和可視化工具就可以將分析結果展現在用戶面前以幫助用戶計劃將采取怎樣的行動
  產生利潤的工具
   有很多公司都成功地安裝了數據挖掘工具早先采用了這種技術的公司大部分都是信息密集型公司比如金融服務和郵件營銷系統但是現在這種技術已經准備好應用於各個公司中只要公司具有大型數據庫並且有強烈的通過軟件技術改善公司管理的願望但是采用數據挖掘技術公司必須兩個關鍵的因素一個就是大型的集成化的數據庫另一個就是定義完善的商業處理程序這樣數據挖掘才好緊密地應用於公司數據之上
   采用數據挖掘技術的一些成功應用例如一個藥品公司通過對它最近的營銷強度和銷售結果的分析來決定哪一種營銷活動在最近幾個月內對高附加值的醫生群體影響最大這樣的分析建立在競爭對手的銷售活動信息和當地健康狀況的數據系統之上然後這個藥品公司可以通過其辦公網絡將分析結果傳達到各地的銷售代表處銷售代表們則可以根據公司傳遞的關鍵信息來作出相應的銷售抉擇這樣在快速變化的動態的市場上銷售代表們都可以根據各種特殊情況的分析作出最優的選擇
  結語
   全面集成了客戶供應者以及市場信息的大型數據倉庫導致公司內的信息呈爆炸性增長企業在市場競爭中需要及時而准確地對這些信息作復雜的分析為了更加及時地更加准確地作出利於企業的抉擇建立在關系數據庫和聯機分析技術上的數據挖掘工具為我們帶來了一個新的轉機目前數據挖掘工具正以前所未有的速度發展並且擴大著用戶群體在未來越加激烈的市場競爭中擁有數據挖掘技術必將比別人獲得更快速的反應贏得更多的商業機會
  

From:http://tw.wingwit.com/Article/program/Oracle/201311/16986.html
    推薦文章
    Copyright © 2005-2013 電腦知識網 Computer Knowledge   All rights reserved.