詳細的介紹了Oracle數據庫SQL語句性能調整的基本原則具體內容請參考下文
一問題的提出
在應用系統開發初期由於開發數據庫數據比較少對於查詢SQL語句復雜視圖的的編寫等體會不出SQL語句各種寫法的性能優劣但是如果將應用系統提交實際應用後隨著數據庫中數據的增加系統的響應速度就成為目前系統需要解決的最主要的問題之一系統優化中一個很重要的方面就是SQL語句的優化對於海量數據劣質SQL語句和優質SQL語句之間的速度差別可以達到上百倍可見對於一個系統不是簡單地能實現其功能就可而是要寫出高質量的SQL語句提高系統的可用性
在多數情況下Oracle使用索引來更快地遍歷表優化器主要根據定義的索引來提高性能但是如果在SQL語句的where子句中寫的SQL代碼不合理就會造成優化器刪去索引而使用全表掃描一般就這種SQL語句就是所謂的劣質SQL語句在編寫SQL語句時我們應清楚優化器根據何種原則來刪除索引這有助於寫出高性能的SQL語句
二SQL語句編寫注意問題
下面就某些SQL語句的where子句編寫中需要注意的問題作詳細介紹在這些where子句中即使某些列存在索引但是由於編寫了劣質的SQL系統在運行該SQL語句時也不能使用該索引而同樣使用全表掃描這就造成了響應速度的極大降低
IS NULL 與 IS NOT NULL
不能用null作索引任何包含null值的列都將不會被包含在索引中即使索引有多列這樣的情況下只要這些列中有一列含有null該列就會從索引中排除也就是說如果某列存在空值即使對該列建索引也不會提高性能任何在where子句中使用is null或is not null的語句優化器是不允許使用索引的
聯接列
對於有聯接的列即使最後的聯接值為一個靜態值優化器是不會使用索引的我們一起來看一個例子假定有一個職工表(employee)對於一個職工的姓和名分成兩列存放(FIRST_NAME和LAST_NAME)現在要查詢一個叫比爾克林頓(Bill Cliton)的職工
下面是一個采用聯接查詢的SQL語句:
select * from employss
where
first_name||||last_name =Beill Cliton;
上面這條語句完全可以查詢出是否有Bill Cliton這個員工但是這裡需要注意系統優化器對基於last_name創建的索引沒有使用
當采用下面這種SQL語句的編寫Oracle系統就可以采用基於last_name創建的索引
Select * from employee
where
first_name =Beill and last_name =Cliton;
遇到下面這種情況又如何處理呢?如果一個變量(name)中存放著Bill Cliton這個員工的姓名對於這種情況我們又如何避免全程遍歷使用索引呢?可以使用一個函數將變量name中的姓和名分開就可以了但是有一點需要注意這個函數是不能作用在索引列上下面是SQL查詢腳本
select * from employee
where
first_name = SUBSTR(&&nameINSTR(&&name ))
and
last_name = SUBSTR(&&nameINSTR(&&name )+)
帶通配符(%)的like語句
同樣以上面的例子來看這種情況目前的需求是這樣的要求在職工表中查詢名字中包含cliton的人可以采用如下的查詢SQL語句
select * from employee where last_name like %cliton%;
這裡由於通配符(%)在搜尋詞首出現所以Oracle系統不使用last_name的索引在很多情況下可能無法避免這種情況但是一定要心中有底通配符如此使用會降低查詢速度然而當通配符出現在字符串其他位置時優化器就能利用索引在下面的查詢中索引得到了使用
select * from employee where last_name like c%;
Order by語句
ORDER BY語句決定了Oracle如何將返回的查詢結果排序Order by語句對要排序的列沒有什麼特別的限制也可以將函數加入列中(象聯接或者附加等)任何在Order by語句的非索引項或者有計算表達式都將降低查詢速度
仔細檢查order by語句以找出非索引項或者表達式它們會降低性能解決這個問題的辦法就是重寫order by語句以使用索引也可以為所使用的列建立另外一個索引同時應絕對避免在order by子句中使用表達式
NOT
我們在查詢時經常在where子句使用一些邏輯表達式如大於小於等於以及不等於等等也可以使用and(與)or(或)以及not(非)NOT可用來對任何邏輯運算符號取反下面是一個NOT子句的例子
where not (status =VALID)
如果要使用NOT則應在取反的短語前面加上括號並在短語前面加上NOT運算符NOT運算符包含在另外一個邏輯運算符中這就是不等於(<>)運算符換句話說即使不在查詢where子句中顯式地加入NOT詞NOT仍在運算符中見下例
where status <>INVALID;
再看下面這個例子
select * from employee where salary<>;
對這個查詢可以改寫為不使用NOT
select * from employee where salary< or salary>;
雖然這兩種查詢的結果一樣但是第二種查詢方案會比第一種查詢方案更快些第二種查詢允許Oracle對salary列使用索引而第一種查詢則不能使用索引
IN和EXISTS
有時候會將一列和一系列值相比較最簡單的辦法就是在where子句中使用子查詢在where子句中可以使用兩種格式的子查詢
第一種格式是使用IN操作符
where column in(select * from where );
第二種格式是使用EXIST操作符
where exists (select X from where );
我相信絕大多數人會使用第一種格式因為它比較容易編寫而實際上第二種格式要遠比第一種格式的效率高在Oracle中可以幾乎將所有的IN操作符子查詢改寫為使用EXISTS的子查詢
第二種格式中子查詢以select X開始運用EXISTS子句不管子查詢從表中抽取什麼數據它只查看where子句這樣優化器就不必遍歷整個表而僅根據索引就可完成工作(這裡假定在where語句中使用的列存在索引)相對於IN子句來說EXISTS使用相連子查詢構造起來要比IN子查詢困難一些
通過使用EXISTOracle系統會首先檢查主查詢然後運行子查詢直到它找到第一個匹配項這就節省了時間Oracle系統在執行IN子查詢時首先執行子查詢並將獲得的結果列表存放在在一個加了索引的臨時表中在執行子查詢之前系統先將主查詢掛起待子查詢執行完畢存放在臨時表中以後再執行主查詢這也就是使用EXISTS比使用IN通常查詢速度快的原因
同時應盡可能使用NOT EXISTS來代替NOT IN盡管二者都使用了NOT(不能使用索引而降低速度)NOT EXISTS要比NOT IN查詢效率更高
=====================================================
Oracle的SQL調優是一個復雜的主題甚至是需要整本書來介紹OracleSQL調優的細微差別不過有一些基本的規則是每個OracleDBA都需要跟從的這些規則可以改善他們系統的性能SQL調優的目標是簡單的
消除不必要的大表全表搜索不必要的全表搜索導致大量不必要的I/O從而拖慢整個數據庫的性能調優專家首先會根據查詢返回的行數目來評價SQL在一個有序的表中如果查詢返回少於%的行或者在一個無序的表中返回少於%的行那麼這個查詢都可以調整為使用一個索引來代替全表搜索對於不必要的全表搜索來說最常見的調優方法是增加索引可以在表中加入標准的B樹索引也可以加入bitmap和基於函數的索引要決定是否消除一個全表搜索你可以仔細檢查索引搜索的I/O開銷和全表搜索的開銷它們的開銷和數據塊的讀取和可能的並行執行有關並將兩者作對比在一些情況下一些不必要的全表搜索的消除可以通過強制使用一個index來達到只需要在SQL語句中加入一個索引的提示就可以了
在全表搜索是一個最快的訪問方法時將小表的全表搜索放到緩存中調優專家應該確保有一個專門的數據緩沖用作行緩沖在Oracle中你可以使用altertablexxxcache語句在Oracle或以上小表可以被強制為放到KEEP池中緩沖
確保最優的索引使用對於改善查詢的速度這是特別重要的有時Oracle可以選擇多個索引來進行查詢調優專家必須檢查每個索引並且確保Oracle使用正確的索引它還包括bitmap和基於函數的索引的使用
確保最優的JOIN操作有些查詢使用NESTEDLOOPjoin快一些有些則是HASHjoin快一些另外一些則是sortmergejoin更快
這些規則看來簡單不過它們占SQL調優任務的%並且它們也無需完全懂得OracleSQL的內部運作以下我們來簡單概覽以下OracleSQL的優化
我們首先簡要查看Oracle的排序並且看一看排序操作是如何影響性能的
調整Oracle的排序操作
排序是SQL語法中一個小的方面但很重要在Oracle的調整中它常常被忽略當使用createindexORDERBY或者GROUPBY的語句時Oracle數據庫將會自動執行排序的操作通常在以下的情況下Oracle會進行排序的操作
使用Orderby的SQL語句
使用Groupby的SQL語句
在創建索引的時候
進行tablejoin時由於現有索引的不足而導致SQL優化器調用MERGESORT
當與Oracle建立起一個session時在內存中就會為該session分配一個私有的排序區域如果該連接是一個專用的連接(dedicatedconnection)那麼就會根據initora中sort_area_size參數的大小在內存中分配一個ProgramGlobalArea(PGA)如果連接是通過多線程服務器建立的那麼排序的空間就在large_pool中分配不幸的是對於所有的session用做排序的內存量都必須是一樣的我們不能為需要更大排序的操作分配額外的排序區域因此設計者必須作出一個平衡在分配足夠的排序區域以避免發生大的排序任務時出現磁盤排序(disksorts)的同時對於那些並不需要進行很大排序的任務就會出現一些浪費當然當排序的空間需求超出了sort_area_size的大小時這時將會在TEMP表空間中分頁進行磁盤排序磁盤排序要比內存排序大概慢倍
上面我們已經提到私有排序區域的大小是有initora中的sort_area_size參數決定的每個排序所占用的大小由initora中的sort_area_retained_size參數決定當排序不能在分配的空間中完成時就會使用磁盤排序的方式即在Oracle實例中的臨時表空間中進行
磁盤排序的開銷是很大的有幾個方面的原因首先和內存排序相比較它們特別慢而且磁盤排序會消耗臨時表空間中的資源Oracle還必須分配緩沖池塊來保持臨時表空間中的塊無論什麼時候內存排序都比磁盤排序好磁盤排序將會令任務變慢並且會影響Oracle實例的當前任務的執行還有過多的磁盤排序將會令freebufferwaits的值變高從而令其它任務的數據塊由緩沖中移走
From:http://tw.wingwit.com/Article/program/Oracle/201311/16645.html