數(shù)據(jù)庫是應(yīng)用程序和計(jì)算機(jī)的核心元素,并負(fù)責(zé)存儲運(yùn)行軟件應(yīng)用程序所需的所有重要數(shù)據(jù)。為了確保應(yīng)用程序的正常運(yùn)行,總是有一個或多個數(shù)據(jù)庫靜默運(yùn)行。我們可以將數(shù)據(jù)庫視為一個信息倉庫,以結(jié)構(gòu)化的方式存儲大量相關(guān)信息,并對其進(jìn)行合理分類以方便搜索和使用。因此,數(shù)據(jù)庫設(shè)計(jì)已成為軟件開發(fā)的重要組成部分。那么數(shù)據(jù)庫設(shè)計(jì)技巧有哪些?關(guān)于數(shù)據(jù)庫設(shè)計(jì)技巧有很多,這里簡單的介紹7種方法。
數(shù)據(jù)庫設(shè)計(jì)技巧有哪些?
1. 原始單據(jù)與實(shí)體之間的關(guān)系
可以是一對一、一對多、多對多的關(guān)系。在一般情況下,它們是一對一的關(guān)系:即一張?jiān)紗螕?jù)對應(yīng)且只對應(yīng)一個實(shí)體。在特殊情況下,它們可能是一對多或多對一的關(guān)系,即一張?jiān)紗巫C對應(yīng)多個實(shí)體,或多張?jiān)紗巫C對應(yīng)一個實(shí)體。這里的實(shí)體可以理解為基本表。明確這種對應(yīng)關(guān)系后,對我們設(shè)計(jì)錄入界面大有好處。
比如:一份員工履歷資料,在人力資源信息系統(tǒng)中,就對應(yīng)三個基本表:員工基本情況表、社會關(guān)系表、工作簡歷表。這就是“一張?jiān)紗巫C對應(yīng)多個實(shí)體”的典型例子。
2. 主鍵與外鍵
一般而言,一個實(shí)體不能既無主鍵又無外鍵。在E—R 圖中, 處于葉子部位的實(shí)體, 可以定義主鍵,也可以不定義主鍵(因?yàn)樗鼰o子孫), 但必須要有外鍵(因?yàn)樗懈赣H)。 主鍵與外鍵的設(shè)計(jì),在全局?jǐn)?shù)據(jù)庫的設(shè)計(jì)中,占有重要地位。當(dāng)全局?jǐn)?shù)據(jù)庫的設(shè)計(jì)完成以后,有個美國數(shù)據(jù)庫設(shè)計(jì)專家說:“鍵,到處都是鍵,除了鍵之外,什么也沒有”,這就是他的數(shù)據(jù)庫設(shè)計(jì)經(jīng)驗(yàn)之談,也反映了他對信息系統(tǒng)核心(數(shù)據(jù)模型)的高度抽象思想。因?yàn)椋褐麈I是實(shí)體的高度抽象,主鍵與外鍵的配對,表示實(shí)體之間的連接。
3. 基本表的性質(zhì)
基本表與中間表、臨時表不同,因?yàn)樗哂腥缦滤膫€特性:
原子性。基本表中的字段是不可再分解的。
原始性。基本表中的記錄是原始數(shù)據(jù)(基礎(chǔ)數(shù)據(jù))的記錄。
演繹性。由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。
穩(wěn)定性。基本表的結(jié)構(gòu)是相對穩(wěn)定的,表中的記錄是要長期保存的。
理解基本表的性質(zhì)后,在設(shè)計(jì)數(shù)據(jù)庫時,就能將基本表與中間表、臨時表區(qū)分開來。
4. 范式標(biāo)準(zhǔn)
基本表及其字段之間的關(guān)系, 應(yīng)盡量滿足第三范式。但是,滿足第三范式的數(shù)據(jù)庫設(shè)計(jì),往往不是最好的設(shè)計(jì)。為了提高數(shù)據(jù)庫的運(yùn)行效率,常常需要降低范式標(biāo)準(zhǔn):適當(dāng)增加冗余,達(dá)到以空間換時間的目的。
比如有一張存放商品的基本表,如表1所示。“金額”這個字段的存在,表明該表的設(shè)計(jì)不滿足第三范式,因?yàn)椤敖痤~”可以由“單價”乘以“數(shù)量”得到,說明“金額”是冗余字段。但是,增加“金額”這個冗余字段,可以提高查詢統(tǒng)計(jì)的速度,這就是以空間換時間的作法。
在Rose 2002中,規(guī)定列有兩種類型:數(shù)據(jù)列和計(jì)算列。“金額”這樣的列被稱為“計(jì)算列”,而“單價”和“數(shù)量”這樣的列被稱為“數(shù)據(jù)列”。
5.通俗地理解三個范式
通俗地理解三個范式,對于數(shù)據(jù)庫設(shè)計(jì)大有好處。在數(shù)據(jù)庫設(shè)計(jì)中,為了更好地應(yīng)用三個范式,就必須通俗地理解三個范式(通俗地理解是夠用的理解,并不是最科學(xué)最準(zhǔn)確的理解):
第一范式:1NF是對屬性的原子性約束,要求屬性具有原子性,不可再分解;
第二范式:2NF是對記錄的惟一性約束,要求記錄有惟一標(biāo)識,即實(shí)體的惟一性;
第三范式:3NF是對字段冗余性的約束,即任何字段不能由其他字段派生出來,它要求字段沒有冗余。
沒有冗余的數(shù)據(jù)庫設(shè)計(jì)可以做到。但是,沒有冗余的數(shù)據(jù)庫未必是最好的數(shù)據(jù)庫,有時為了提高運(yùn)行效率,就必須降低范式標(biāo)準(zhǔn),適當(dāng)保留冗余數(shù)據(jù)。具體做法是:在概念數(shù)據(jù)模型設(shè)計(jì)時遵守第三范式,降低范式標(biāo)準(zhǔn)的工作放到物理數(shù)據(jù)模型設(shè)計(jì)時考慮。降低范式就是增加字段,允許冗余。
6.要善于識別與正確處理多對多的關(guān)系
若兩個實(shí)體之間存在多對多的關(guān)系,則應(yīng)消除這種關(guān)系。消除的辦法是,在兩者之間增加第三個實(shí)體。這樣,原來一個多對多的關(guān)系,現(xiàn)在變?yōu)閮蓚€一對多的關(guān)系。要將原來兩個實(shí)體的屬性合理地分配到三個實(shí)體中去。這里的第三個實(shí)體,實(shí)質(zhì)上是一個較復(fù)雜的關(guān)系,它對應(yīng)一張基本表。一般來講,數(shù)據(jù)庫設(shè)計(jì)工具不能識別多對多的關(guān)系,但能處理多對多的關(guān)系。
比如在“圖書館信息系統(tǒng)”中,“圖書”是一個實(shí)體,“讀者”也是一個實(shí)體。這兩個實(shí)體之間的關(guān)系,是一個典型的多對多關(guān)系:一本圖書在不同時間可以被多個讀者借閱,一個讀者又可以借多本圖書。為此,要在二者之間增加第三個實(shí)體,該實(shí)體取名為“借還書”,它的屬性為:借還時間、借還標(biāo)志(0表示借書,1表示還書),另外,它還應(yīng)該有兩個外鍵(“圖書”的主鍵,“讀者”的主鍵),使它能與“圖書”和“讀者”連接。
7.主鍵PK的取值方法
PK是供程序員使用的表間連接工具,可以是一無物理意義的數(shù)字串, 由程序自動加1來實(shí)現(xiàn)。也可以是有物理意義的字段名或字段名的組合。不過前者比后者好。當(dāng)PK是字段名的組合時,建議字段的個數(shù)不要太多,多了不但索引占用空間大,而且速度也慢。
好了,關(guān)于數(shù)據(jù)庫設(shè)計(jì)技巧有哪些的問題,介紹到這里就結(jié)束了,關(guān)于數(shù)據(jù)庫設(shè)計(jì)技巧還有很多,想了解請繼續(xù)關(guān)注中培偉業(yè)。