目的
本教程介紹如何使用 Oracle Data Mining 解決業務問題
所需時間
大約 個小時
主題
本教程包括下列主題:
概述
情景
前提條件
啟動 Oracle Data Miner
為數據挖掘准備數據
使用挖掘活動指南
總結
注意:此外您還可以在下列步驟中將鼠標放在每個單獨的圖標上從而僅加載和查看與該步驟相關的屏幕截圖您可以單擊單個屏幕截圖將其隱藏
概述
數據挖掘有時稱為知識發現 — 其目的是提供其他方法無法找到可執行 (actionable) 信息該信息可以改進您業務的運作例如假設一個營銷活動產生 % 的積極響應如果數據挖掘有助於使該活動專門針對最可能響應的人從而產生 % 的響應則該業務將增加 % 的利潤
可以把數據挖掘分為兩類學習
監管的學習目的是預測描述某個行為的特定特征或屬性的值預測的屬性稱為目標屬性
無監管的學習目的是發現關系和模式而非確定具體的值這種情形下沒有目標屬性
Oracle Data Mining 是 Oracle 數據庫中內嵌的強大的數據挖掘軟件它使您能夠揭示隱藏在數據中的新洞察Oracle Data Mining 能夠幫助企業瞄准最佳客戶發現和防止欺詐發現對關鍵績效指標 (KPI) 最有影響的屬性以及發現隱藏在數據中的有價值的新信息Oracle Data Mining 幫助技術專家找出數據中的模式識別關鍵屬性發現新的集群和關聯並揭示有價值的洞察
Oracle Data Mining 使公司能夠:
了解更多信息利用您的數據並發現以前隱藏的有價值的新信息和見解
進行更多操作 構建自動提取和傳播新信息和見解的的應用程序
花費更少 Oracle Data Mining 比傳統方法要便宜得多作為您在 Oracle 技術中投資的一部分它可以顯著降低您的總擁有成本
Oracle Data Mining 超越了標准查詢和報表工具以及聯機分析處理 (OLAP) 工具查詢和報表工具以及 OLAP 工具可以告訴您誰是您的重要客戶哪些產品賣的最多以及哪些方面的成本最高使用 Oracle Data Mining您可以實施策略來:
預測和防止客戶流失
獲得新客戶並識別最能帶來收益的客戶
識別會成功的交叉銷售機會
洞察違規的和欺詐性的活動
發現新的集群或片斷
開發客戶概要文件
識別藥物發明中的可能目標和有希望的線索
找出同時出現的項目和/或事件的關聯關系
挖掘非結構化數據即文本
傳統商務智能 (BI) 工具(例如報表工具交互式查詢和報表工具以及聯機分析處理 (OLAP) 工具)只報告過去發生的事情而 Oracle Data Mining (ODM) 使您能夠超越傳統 BI 和報表工具使您可以挖掘您的數據以及構建高級數據挖掘應用程序ODM 使您能夠發現新見解片斷和關聯進行更准確的預測找到最能影響您業務的變量而且通常從您的數據提取更多信息例如通過分析您最佳客戶的個人信息ODM 使您能夠構建數據挖掘模型和集成的應用程序來識別將來可能成為您最佳客戶的客戶這些客戶可能不表現為您目前最有價值的客戶但可能與您當前最佳客戶的有相似的個人信息此外使用 ODM您可以進行更多操作並將預測模型實現為一個定期運行的生產應用程序該應用程序在每個周一早上將您最有希望的客戶列表分發到您的銷售團隊了解您客戶的戰略價值(哪些可能成為將來能帶來收益的客戶或者相反)或者預測哪些客戶可能熱衷或響應營銷策略而且將該信息集成到您的運營中對於積極管理業務來說是至關重要的
使用 Oracle Data Mining 解決業務問題的階段如下所示:
就數據挖掘和業務目標而言的問題定義
數據獲取和准備
構建和評估模型
部署
注意:本教程並不打算完整介紹 Oracle Data Mining它只是介紹了進行某些常見數據挖掘操作所需的技術如果您需要有關其中某些主題的更多背景信息請參閱《Oracle Data Mining 概念指南》
情景
一個電子產品連鎖店想為客戶發打折卡但只想發給那些預期將因為此卡而增加購買量(從而使公司增收)的客戶因此根據在一部分客戶中開展了一個試驗性的促銷活動並將結果匯總到一個表中其中包含客戶人口統計信息采購模式以及每個客戶所帶來收入的測算
然後使用一個描述試驗性促銷活動中的客戶和結果的數據集創建可以應用於所有客戶的模型以便預測使用打折卡的每個客戶的預期收入級別 — 將預測的目標屬性為 AFFINITY_CARD它的值可以是 (低利潤)或 (高利潤)不同的目標值(在本例中為 或 )有時稱為目標類因此預測每個客戶的目標值稱為分類
前提條件
開始本教程之前您應該:
完成了教程在 Windows 上安裝 Oracle 數據庫 g
完成教程:安裝 Oracle Data Miner g 第 版
返回主題列表
啟動 Oracle Data Miner
要啟動 Oracle Data Miner執行以下操作
雙擊 \bin\odminerwexe

要以 dmuser 連接單擊 OK

您可能想在您的用戶架構中確認示例表和視圖展開 Data Sources > dmuser
這將顯示表和視圖單擊 Tables 查看表;單擊 Views 獲取視圖列表

為數據挖掘准備數據
Data Mining 過程中使用的數據通常必須從不同位置收集此外准備數據進行 Data Mining 操作可能需要對數據進行某種變換Oracle Data Mining 有很多強大的實用程序可用於取樣記錄離散和創建新變換的屬性
在本部分中您將執行以下任務:
顯示數據和統計信息
使用數據變換向導
顯示數據和統計信息
執行以下步驟:
可以顯示表或視圖的結構單擊 MINING_DATA_BUILD_V

單擊 Data 選項卡查看內容示例

滾到窗口右側查看完整的詳細信息

注意:默認顯示記錄數為 ;在 Fetch Size 窗口中輸入不同的數然後單擊 Refresh 更新顯示的大小此外可以單擊 Fetch Next 增加顯示的行
右擊 MINING_DATA_BUILD_V 顯示具有更多選項的菜單可以使用 Transformation 向導和其他工具進行數據發掘

要查看統計匯總可以根據數據格式類型單擊兩個選項之一單擊 Show Summary SingleRecord

您的輸出應該如以下圖像所示:

對於每個數值性屬性顯示了 Maximum 和 Minimum 值以及平均值和變量這些統計信息基於示例計算而來本例中的示例大小是 可以通過調整 ODM Preferences(位於 Tools 下拉菜單)來更改示例大小
對於任何突出顯示的屬性可以查看值的分類
a突出顯示 AFFINITY_CARD

b單擊 Histogram

默認 bin 最多為 ;可通過單擊 Preferences 更改該數字
數值性屬性分為最小和最大之間等寬的指定 bin 數這些 bin 以屬性值的升序顯示分類屬性使用Top N方法(N 是 bin 的數量)劃分 bin出現頻率最多的 N 值有自己的 bin其他值放入一個標記為Other的 bin 中這些 bin 以 bin 大小的降序顯示
當檢查完時單擊 OK然後關閉 Data Summarization Viewer 窗口
使用數據變換向導
Mining Activity Guides 幫助您將不同源中的數據匯總到一個視圖或表中此外它們執行特定算法所需的變換但是使用以下數據變換向導通常可以單獨完成某些轉換
篩選器
重新編碼
派生字段
在本教程中您將學習如何使用 Filter Single Record Transformation 向導
假設您只想關注 歲到 歲之間的客戶則可以篩選數據從而只包括那些人Oracle Data Miner 提供篩選變換來基於屬性值定義數據子集執行以下步驟:
單擊 Data > Transform > Filter SingleRecord

在 Welcome 頁面中單擊 Next

識別輸入數據並單擊 Next本例中使用的視圖是 MINING_DATA_BUILD_V

注意:如果通過您右擊該表或視圖名訪問該向導則會因該數據是已知的而跳過該步驟
為所得視圖輸入名稱然後單擊 Next

在 Filter 文本框中輸入篩選條件此外要在對話框中構造條件單擊 Filter 域右邊的圖標

在 Expression Editor 頁面中執行以下步驟:
a雙擊屬性名 AGE

b單擊 >= 按鈕並鍵入 構造所顯示條件的第一部分

c單擊 AND 繼續定義完整條件雙擊 AGE

d 單擊 <= 按鈕並鍵入

e 單擊 Validate 按鈕查看是否有源數據子集滿足該條件

f 單擊 OK 在 Filter 窗口中顯示該條件

單擊 Next

單擊 Finish 完成該變換

您的輸出應該如以下圖像所示:

使用挖掘活動指南
當定義了數據挖掘問題並識別源數據時數據挖掘過程還剩兩個階段:構建/評估模型並顯示結果Oracle Data Miner 包含活動指南其目的在盡量減少這些階段的所需的干預此外Build 活動中使用的隱式和顯式選擇和設置可以無縫地傳遞給 Apply 活動因此隱藏或消除了很多通常需要的操作
Build Activity Wizard 允許您:
識別要添加到事例表(基本的源數據)中的補充數據
選擇數據挖掘功能和算法
手動調整 Activity 設置而非接受自動設置
該示例在處理高利潤或低利潤客戶的個人信息時使用決策樹分類算法創建計算和應用預測模型分類客戶您需要執行下列任務:
使用一種挖掘活動生成一個預測模型
使用 Mining 活動應用一個預測模型
使用一種挖掘活動生成一個預測模型
對於該主題使用原始視圖而非剛創建的視圖單擊左導航器中的 MINING_DATA_BUILD_V

要啟動 Activity Build Wizard單擊 Activity > Build

顯示 New Activity WizardWelcome 頁面單擊 Next

在 Select Mining Type 頁面上接受默認的 Classification Function Type 以及 Decision Tree Algorithm單擊 Next

要選擇將從示例表或視圖挖掘的所有數據確保未選中 Join additional data with case table 框如果選中該框可以指定要與該事例表聯接的其他表和架構的數據該示例假設在本例中所有必需的數據均位於事例表 MINING_DATA_BUILD_V 中從 Unique Identifier 下拉列表選擇 CUST_ID然後單擊 Next

您可以針對數據挖掘問題指定要預測的屬性單擊 AFFINITY_CARD 單選按鈕指示目標然後單擊 Next
注意:本教程中要預測的目標屬性為 AFFINITY_CARD

一些評估結果取決於您選的 Preferred Target Value在本例中您要識別高利潤客戶 (Target Value = )選擇 作為 Preferred Target Value 並單擊 Next

為活動輸入描述性的名稱並單擊 Next

顯示 Activity Wizard 的最後一步您可以在 Activity 中顯示這些設置單擊 Advanced Settings

這些參數的默認設置即可確保好的結果Build 參數確定如何構造決策樹的分支單擊 OK

確保選中 Run upon finish 復選框單擊 Finish

當完成 Activity Wizard 時將顯示所選活動對應的步驟如果您選擇 Run Upon Finish將順次完成這些步驟而且每完成一個步驟將在其右側顯示一個檢查標記
From:http://tw.wingwit.com/Article/program/Oracle/201311/16618.html