如果你正在負責一個基於SQL Server的項目或者你剛剛接觸SQL Server你都有可能要面臨一些數據庫性能的問題這篇文章會為你提供一些有用的指導(其中大多數也可以用於其它的DBMS)
在這裡我不打算介紹使用SQL Server的竅門也不能提供一個包治百病的方案我所做的是總結一些經驗關於如何形成一個好的設計這些經驗來自我過去幾年中經受的教訓一直來我看到許多同樣的設計錯誤被一次又一次的重復
你了解你用的工具嗎?
不要輕視這一點這是我在這篇文章中講述的最關鍵的一條也許你也看到有很多的SQL Server程序員沒有掌握全部的TSQL命令和SQL Server提供的那些有用的工具
什麼?我要浪費一個月的時間來學習那些我永遠也不會用到的SQL命令???你也許會這樣說對的你不需要這樣做但是你應該用一個周末浏覽所有的TSQL命令在這裡你的任務是了解將來當你設計一個查詢時你會記起來對了這裡有一個命令可以完全實現我需要的功能於是到MSDN查看這個命令的確切語法
不要使用游標
讓我再重復一遍不要使用游標如果你想破壞整個系統的性能的話它們倒是你最有效的首選辦法大多數的初學者都使用游標而沒有意識到它們對性能造成的影響它們占用內存還用它們那些不可思議的方式鎖定表另外它們簡直就像蝸牛而最糟糕的是它們可以使你的DBA所能做的一切性能優化等於沒做不知你是否知道每執行一次FETCH就等於執行一次SELECT命令?這意味著如果你的游標有條記錄它將執行次SELECT!如果你使用一組SELECTUPDATE或者DELETE來完成相應的工作那將有效率的多
初學者一般認為使用游標是一種比較熟悉和舒適的編程方式可很不幸這會導致糟糕的性能顯然SQL的總體目的是你要實現什麼而不是怎樣實現
我曾經用TSQL重寫了一個基於游標的存儲過程那個表只有條記錄原來的存儲過程用了分鐘才執行完畢而新的存儲過程只用了秒鐘在這裡我想你應該可以看到一個不稱職的程序員究竟在干了什麼!!!
我們可以寫一個小程序來取得和處理數據並且更新數據庫這樣做有時會更有效記住對於循環TSQL無能為力
我再重新提醒一下使用游標沒有好處除了DBA的工作外我從來沒有看到過使用游標可以有效的完成任何工作
規范化你的數據表
為什麼不規范化數據庫?大概有兩個借口出於性能的考慮和純粹因為懶惰至於第二點你遲早得為此付出代價而關於性能的問題你不需要優化根本就不慢的東西我經常看到一些程序員反規范化數據庫他們的理由是原來的設計太慢了可結果卻常常是他們讓系統更慢了DBMS被設計用來處理規范數據庫的因此記住按照規范化的要求設計數據庫
不要使用SELECT *
這點不太容易做到我太了解了因為我自己就經常這樣干可是如果在SELECT中指定你所需要的列那將會帶來以下的好處
減少內存耗費和網絡的帶寬
你可以得到更安全的設計
給查詢優化器機會從索引讀取所有需要的列
了解你將要對數據進行的操作
為你的數據庫創建一個健壯的索引那可是功德一件可要做到這一點簡直就是一門藝術每當你為一個表添加一個索引SELECT會更快了可INSERT和DELETE卻大大的變慢了因為創建了維護索引需要許多額外的工作顯然這裡問題的關鍵是你要對這張表進行什麼樣的操作這個問題不太好把握特別是涉及DELETE和UPDATE時因為這些語句經常在WHERE部分包含SELECT命令
不要給性別列創建索引
首先我們必須了解索引是如何加速對表的訪問的你可以將索引理解為基於一定的標准上對表進行劃分的一種方式如果你給類似於性別這樣的列創建了一個索引你僅僅是將表劃分為兩部分男和女你在處理一個有條記錄的表這樣的劃分有什麼意義?記住維護索引是比較費時的當你設計索引時請遵循這樣的規則根據列可能包含不同內容的數目從多到少排列比如姓名 省份 性別
使用事務
請使用事務特別是當查詢比較耗時如果系統出現問題這樣做會救你一命的一般有些經驗的程序員都有體會你經常會碰到一些不可預料的情況會導致存儲過程崩潰
小心死鎖
按照一定的次序來訪問你的表如果你先鎖住表A再鎖住表B那麼在所有的存儲過程中都要按照這個順序來鎖定它們如果你(不經意的)某個存儲過程中先鎖定表B再鎖定表A這可能就會導致一個死鎖如果鎖定順序沒有被預先詳細的設計好死鎖是不太容易被發現的
不要打開大的數據集
在CSDN技術論壇中 :)一個經常被提出的問題是我怎樣才能迅速的將條記錄添加到ComboBox中?這是不對的你不能也不需要這樣做很簡單你的用戶要浏覽條記錄才能找到需要的記錄他一定會詛咒你的在這裡你需要的是一個更好的UI你需要為你的用戶顯示不超過或條記錄
不要使用服務器端游標
與服務器端游標比起來客戶端游標可以減少服務器和網絡的系統開銷並且還減少鎖定時間
使用參數查詢
有時我在CSDN技術論壇看到類似這樣的問題SELECT * FROM a WHERE aid=AB因為單引號查詢發生異常我該怎麼辦?而普遍的回答是用兩個單引號代替單引號這是錯誤的這樣治標不治本因為你還會在其他一些字符上遇到這樣的問題更何況這樣會導致嚴重的bug除此以外這樣做還會使SQL Server的緩沖系統無法發揮應有的作用使用參數查詢 釜底抽薪這些問題統統不存在了
在程序編碼時使用大數據量的數據庫
程序員在開發中使用的測試數據庫一般數據量都不大可經常的是最終用戶的數據量都很大我們通常的做法是不對的原因很簡單現在硬盤不是很貴可為什麼性能問題卻要等到已經無可挽回的時候才被注意呢?
不要使用INSERT導入大批的數據
請不要這樣做除非那是必須的使用UTS或者BCP這樣你可以一舉而兼得靈活性和速度
注意超時問題
查詢數據庫時一般數據庫的缺省都比較小比如秒或者秒而有些查詢運行時間要比這長特別是當數據庫的數據量不斷變大時
不要忽略同時修改同一記錄的問題
有時候兩個用戶會同時修改同一記錄這樣後一個修改者修改了前一個修改者的操作某些更新就會丟失處理這種情況不是很難創建一個timestamp字段在寫入前檢查它如果允許就合並修改如果存在沖突提示用戶
在細節表中插入紀錄時不要在主表執行SELECT MAX(ID)
這是一個普遍的錯誤當兩個用戶在同一時間插入數據時這會導致錯誤你可以使用SCOPE_IDENTITYIDENT_CURRENT和@@IDENTITY如果可能不要使用@@IDENTITY因為在有觸發器的情況下它會引起一些問題(詳見這裡的討論)
避免將列設為NULLable
如果可能的話你應該避免將列設為NULLable系統會為NULLable列的每一行分配一個額外的字節查詢時會帶來更多的系統開銷另外將列設為NULLable使編碼變得復雜因為每一次訪問這些列時都必須先進行檢查
我並不是說NULLS是麻煩的根源盡管有些人這樣認為我認為如果你的業務規則中允許空數據那麼將列設為NULLable有時會發揮很好的作用但是如果在類似下面的情況中使用NULLable那簡直就是自討苦吃
CustomerName CustomerAddress CustomerEmail CustomerName CustomerAddress CustomerEmail CustomerName CustomerAddress CustomerEmail
如果出現這種情況你需要規范化你的表了
盡量不要使用TEXT數據類型
除非你使用TEXT處理一個很大的數據否則不要使用它因為它不易於查詢速度慢用的不好還會浪費大量的空間一般的VARCHAR可以更好的處理你的數據
盡量不要使用臨時表
盡量不要使用臨時表除非你必須這樣做一般使用子查詢可以代替臨時表使用臨時表會帶來系統開銷如果你是用COM 進行編程它還會給你帶來很大的麻煩因為COM 使用數據庫連接池而臨時表卻自始至終都存在SQL Server提供了一些替代方案比如Table數據類型
學會分析查詢
SQL Server查詢分析器是你的好伙伴通過它你可以了解查詢和索引是如何影響性能的
使用參照完整性
定義主健唯一性約束和外鍵這樣做可以節約大量的時間
From:http://tw.wingwit.com/Article/program/SQLServer/201311/22158.html