|
關(guān)于數(shù)據(jù)庫優(yōu)化方面的文章很多,但是有的寫的似是而非,有的不切實際,對一個數(shù)據(jù)庫來說,只能做到更優(yōu),不可能最優(yōu),并且由于實際需求不同,優(yōu)化方案還是有所差異,根據(jù)實際需要關(guān)心的方面(速度、存儲空間、可維護性、可拓展性)來優(yōu)化數(shù)據(jù)庫,而這些方面往往又是相互矛盾的,下面結(jié)合網(wǎng)上的一些看法和自己的一些觀點做個總結(jié)。
一個系統(tǒng)的性能的提高,不單單是試運行或者維護階段的性能調(diào)優(yōu),也不單單是開發(fā)階段的事情,而是在整個軟件生命周期都需要注意。所以我希望按照軟件生命周期的不同階段來總結(jié)數(shù)據(jù)庫性能優(yōu)化相關(guān)的注意事項。
一、 分析階段
一般來說,在系統(tǒng)分析階段往往有太多需要關(guān)注的地方,系統(tǒng)各種功能性、可用性、可靠性、安全性需求往往吸引了我們大部分的注意力,但是,我們必須注意,性能是很重要的非功能性需求,必須根據(jù)系統(tǒng)的特點確定其實時性需求、響應時間的需求、硬件的配置等。最好能有各種需求的量化的指標。
另一方面,在分析階段應該根據(jù)各種需求區(qū)分出系統(tǒng)的類型,大的方面,區(qū)分是OLTP(聯(lián)機事務處理系統(tǒng))和OLAP(聯(lián)機分析處理系統(tǒng))。
二、 設計階段
設計階段可以說是以后系統(tǒng)性能的關(guān)鍵階段,在這個階段,有一個關(guān)系到以后幾乎所有性能調(diào)優(yōu)的過程—數(shù)據(jù)庫設計。
在數(shù)據(jù)庫設計完成后,可以進行初步的索引設計,好的索引設計可以指導編碼階段寫出高效率的代碼,為整個系統(tǒng)的性能打下良好的基礎(chǔ)。
以下是性能要求設計階段需要注意的:
1、數(shù)據(jù)庫邏輯設計的規(guī)范化
數(shù)據(jù)庫邏輯設計的規(guī)范化就是我們一般所說的范式,我們可以這樣來簡單理解范式:
第1規(guī)范:沒有重復的組或多值的列,這是數(shù)據(jù)庫設計的最低要求。
第2規(guī)范: 每個非關(guān)鍵字段必須依賴于主關(guān)鍵字,不能依賴于一個組合式主關(guān)鍵字的某些組成部分。消除部分依賴,大部分情況下,數(shù)據(jù)庫設計都應該達到第二范式。
第3規(guī)范: 一個非關(guān)鍵字段不能依賴于另一個非關(guān)鍵字段。消除傳遞依賴,達到第三范式應該是系統(tǒng)中大部分表的要求,除非一些特殊作用的表。
更高的范式要求這里就不再作介紹了,個人認為,如果全部達到第二范式,大部分達到第三范式,系統(tǒng)會產(chǎn)生較少的列和較多的表,因而減少了數(shù)據(jù)冗余,也利于性能的提高。
2、合理的冗余
完全按照規(guī)范化設計的系統(tǒng)幾乎是不可能的,除非系統(tǒng)特別的小,在規(guī)范化設計后,有計劃地加入冗余是必要的。
冗余可以是冗余數(shù)據(jù)庫、冗余表或者冗余字段,不同粒度的冗余可以起到不同的作用。
冗余可以是為了編程方便而增加,也可以是為了性能的提高而增加。從性能角度來說,冗余數(shù)據(jù)庫可以分散數(shù)據(jù)庫壓力,冗余表可以分散數(shù)據(jù)量大的表的并發(fā)壓力,也可以加快特殊查詢的速度,冗余字段可以有效減少數(shù)據(jù)庫表的連接,提高效率。
3、主鍵的設計
主鍵是必要的,SQL SERVER的主鍵同時是一個唯一索引,而且在實際應用中,我們往往選擇最小的鍵組合作為主鍵,所以主鍵往往適合作為表的聚集索引。聚集索引對查詢的影響是比較大的,這個在下面索引的敘述。
在有多個鍵的表,主鍵的選擇也比較重要,一般選擇總的長度小的鍵,小的鍵的比較速度快,同時小的鍵可以使主鍵的B樹結(jié)構(gòu)的層次更少。
主鍵的選擇還要注意組合主鍵的字段次序,對于組合主鍵來說,不同的字段次序的主鍵的性能差別可能會很大,一般應該選擇重復率低、單獨或者組合查詢可能性大的字段放在前面。
4、外鍵的設計
外鍵作為數(shù)據(jù)庫對象,很多人認為麻煩而不用,實際上,外鍵在大部分情況下是很有用的,理由是:
外鍵是最高效的一致性維護方法,數(shù)據(jù)庫的一致性要求,依次可以用外鍵、CHECK約束、規(guī)則約束、觸發(fā)器、客戶端程序,一般認為,離數(shù)據(jù)越近的方法效率越高。
謹慎使用級聯(lián)刪除和級聯(lián)更新,級聯(lián)刪除和級聯(lián)更新作為SQL SERVER 2000當年的新功能,在2005作了保留,應該有其可用之處。我這里說的謹慎,是因為級聯(lián)刪除和級聯(lián)更新有些突破了傳統(tǒng)的關(guān)于外鍵的定義,功能有點太過強大,使用前必須確定自己已經(jīng)把握好其功能范圍,否則,級聯(lián)刪除和級聯(lián)更新可能讓你的數(shù)據(jù)莫名其妙的被修改或者丟失。從性能看級聯(lián)刪除和級聯(lián)更新是比其他方法更高效的方法。
5、字段的設計
字段是數(shù)據(jù)庫最基本的單位,其設計對性能的影響是很大的。需要注意如下:
A、數(shù)據(jù)類型盡量用數(shù)字型,數(shù)字型的比較比字符型的快很多。
B、數(shù)據(jù)類型盡量小,這里的盡量小是指在滿足可以預見的未來需求的前提下的。
C、 盡量不要允許NULL,除非必要,可以用NOT NULL+DEFAULT代替。
D、少用TEXT和IMAGE,二進制字段的讀寫是比較慢的,而且,讀取的方法也不多,大部分情況下最好不用。
E、自增字段要慎用,不利于數(shù)據(jù)遷移。
6、數(shù)據(jù)庫物理存儲和環(huán)境的設計
在設計階段,可以對數(shù)據(jù)庫的物理存儲、操作系統(tǒng)環(huán)境、網(wǎng)絡環(huán)境進行必要的設計,使得我們的系統(tǒng)在將來能適應比較多的用戶并發(fā)和比較大的數(shù)據(jù)量。
這里需要注意文件組的作用,適用文件組可以有效把I/O操作分散到不同的物理硬盤,提高并發(fā)能力。
7、系統(tǒng)設計
整個系統(tǒng)的設計特別是系統(tǒng)結(jié)構(gòu)設計對性能是有很大影響的,對于一般的OLTP系統(tǒng),可以選擇C/S結(jié)構(gòu)、三層的C/S結(jié)構(gòu)等,不同的系統(tǒng)結(jié)構(gòu)其性能的關(guān)鍵也有所不同。
系統(tǒng)設計階段應該歸納一些業(yè)務邏輯放在數(shù)據(jù)庫編程實現(xiàn),數(shù)據(jù)庫編程包括數(shù)據(jù)庫存儲過程、觸發(fā)器和函數(shù)。用數(shù)據(jù)庫編程實現(xiàn)業(yè)務邏輯的好處是減少網(wǎng)絡流量并可更充分利用數(shù)據(jù)庫的預編譯和緩存功能。
8、索引的設計
在設計階段,可以根據(jù)功能和性能的需求進行初步的索引設計,這里需要根據(jù)預計的數(shù)據(jù)量和查詢來設計索引,可能與將來實際使用的時候會有所區(qū)別。
關(guān)于索引的選擇,應改主意:
A、根據(jù)數(shù)據(jù)量決定哪些表需要增加索引,數(shù)據(jù)量小的可以只有主鍵。
B、根據(jù)使用頻率決定哪些字段需要建立索引,選擇經(jīng)常作為連接條件、篩選條件、聚合查詢、排序的字段作為索引的候選字段。
C、把經(jīng)常一起出現(xiàn)的字段組合在一起,組成組合索引,組合索引的字段順序與主鍵一樣,也需要把最常用的字段放在前面,把重復率低的字段放在前面。
D、一個表不要加太多索引,因為索引影響插入和更新的速度。
it知識庫:數(shù)據(jù)庫優(yōu)化方案,轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。