數據庫規范化與優化問題講解

　　數據庫設計是應用程序設計的基礎其性能直接影響應用程序的性能數據庫性能包括存儲空間需求量的大小和查詢響應時間的長短兩個方面為了優化數據庫性能需要對數據庫中的表進行規范化規范化的范式可分為第一范式第二范式第三范式BCNF范式第四范式和第五范式一般來說邏輯數據庫設計會滿足規范化的前級標准但由於滿足第三范式的表結構容易維護且基本滿足實際應用的要求因此實際應用中一般都按照第三范式的標准進行規范化但是規范化也有缺點由於將一個表拆分成為多個表在查詢時需要多表連接降低了查詢速度

　　由於規范化有可能導致查詢速度慢的缺點考慮到一些應用需要較快的響應速度在設計表時應同時考慮對某些表進行反規范化反規范化可以采用以下幾種方法

　　 分割表

　　分割表包括水平分割和垂直分割

　　水平分割是按照行將一個表分割為多個表這可以提高每個表的查詢速度但查詢更新時要選擇不同的表統計時要匯總多個表因此應用程序會更復雜

　　垂直分割是對於一個列很多的表若某些列的訪問頻率遠遠高於其它列就可以將主鍵和這些列作為一個表將主鍵和其它列作為另外一個表通過減少列的寬度增加了每個數據頁的行數一次I/O就可以掃描更多的行從而提高了訪問每一個表的速度但是由於造成了多表連接所以應該在同時查詢或更新不同分割表中的列的情況比較少的情況下使用

　　 保留冗余列

　　當兩個或多個表在查詢中經常需要連接時可以在其中一個表上增加若干冗余的列以避免表之間的連接過於頻繁由於對冗余列的更新操作必須對多個表同步進行所以一般在冗余列的數據不經常變動的情況下使用

　　 增加派生列

　　派生列是由表中的其它多個列計算所得增加派生列可以減少統計運算在數據匯總時可以大大縮短運算時間

　　二　應用程序性能的優化

　　應用程序的優化通常可分為兩個方面源代碼和SQL語句由於涉及到對程序邏輯的改變源代碼的優化在時間成本和風險上代價很高而對數據庫系統性能的提升收效有限因此應用程序的優化應著重在SQL語句的優化對於海量數據劣質SQL語句和優質SQL語句之間的速度差別可以達到上百倍可見對於一個系統不是簡單地能實現其功能就行而是要寫出高質量的SQL語句提高系統的可用性

　　下面就某些SQL語句的where子句編寫中需要注意的問題作詳細介紹在這些where子句中即使某些列存在索引但是由於編寫了劣質的SQL系統在運行該SQL語句時也不能使用該索引而同樣使用全表掃描這就造成了響應速度的極大降低

　　 IS NULL 與 IS NOT NULL

　　不能用null作索引任何包含null值的列都將不會被包含在索引中即使索引有多列的情況下只要這些列中有一列含有null該列就會從索引中排除也就是說如果某列存在空值即使對該列建索引也不會提高性能

　　任何在where子句中使用is null或is not null的語句優化器是不允許使用索引的

　　聯接列

　　對於有聯接的列即使最後的聯接值為一個靜態值優化器不會使用索引的例如假定有一個職工表(employee)對於一個職工的姓和名分成兩列存放(FIRST_NAME和LAST_NAME)現在要查詢一個叫喬治·布什(George Bush)的職工下面是一個采用聯接查詢的SQL語句

　　select * from employee where first_name||||last_name =George Bush;

　　上面這條語句完全可以查詢出是否有George Bush這個員工但是這裡需要注意系統優化器對基於last_name創建的索引沒有使用

　　當采用下面這種SQL語句的編寫Oracle系統就可以采用基於last_name創建的索引

　　Select * From employee where first_name =George and last_name =Bush;

　　遇到下面這種情況又如何處理呢?如果一個變量(name)中存放著George Bush這個員工的姓名對於這種情況我們又如何避免全程遍歷使用索引呢?可以使用一個函數將變量name中的姓和名分開就可以了但是有一點需要注意這個函數是不能作用在索引列上下面是SQL查詢腳本

　　select *

　　from employee where first_name = SUBSTR

　　(&&nameINSTR(&&name ))

　　and last_name = SUBSTR(&&nameINSTR

　　(&&name )+) ;

　　帶通配符(%)的like語句

　　同樣以上面的例子來看這種情況目前的需求是這樣的要求在職工表中查詢名字中包含Bush的人可以采用如下的查詢SQL語句

　　select * from employee where last_name like %Bush%;

　　這裡由於通配符(%)在搜尋詞首出現所以Oracle系統不使用last_name的索引在很多情況下可能無法避免這種情況但是一定要心中有底通配符如此使用會降低查詢速度然而當通配符出現在字符串其他位置時優化器就能利用索引例如在下面的查詢中索引得到了使用

　　select * from employee where last_name like c%;

　　 NOT

　　我們在查詢時經常在where子句使用一些邏輯表達式如大於小於等於以及不等於等等也可以使用and(與)or(或)以及not(非)NOT可用來對任何邏輯運算符號取反下面是一個NOT子句的例子

　　 where not (status =VALID)

　　如果要使用NOT則應在取反的短語前面加上括號並在短語前面加上NOT運算符NOT運算符包含在另外一個邏輯運算符中這就是不等於(<>)運算符換句話說即使不在查詢where子句中顯式地加入NOT詞NOT仍在運算符中見下例

　　 where status <>INVALID;

　　再看下面這個例子

　　select * from employee where　salary<>;

　　對這個查詢可以改寫為不使用NOT的語句

　　select * from employee where　salary< or salary>;

　　雖然這兩種查詢的結果一樣但是第二種查詢方案會比第一種查詢方案更快些第二種查詢允許Oracle對salary列使用索引而第一種查詢則不能使用索引

From:http://tw.wingwit.com/Article/program/SQL/201311/16352.html