數(shù)據(jù)庫復(fù)制的設(shè)計(jì)和管理簡介
【摘 要】 介紹數(shù)據(jù)庫復(fù)制在分布式數(shù)據(jù)庫系統(tǒng)中的應(yīng)用、設(shè)計(jì)和管理,給出了設(shè)計(jì)步驟和設(shè)計(jì)時(shí)考慮的因素。對設(shè)計(jì)和應(yīng)用中出現(xiàn)的沖突問題進(jìn)行了分析并給出了解決辦法。對于數(shù)據(jù)庫復(fù)制環(huán)境的維護(hù)和管理也作了陳述。
關(guān)鍵詞:數(shù)據(jù)庫,分布式系統(tǒng),復(fù)制,管理
1 數(shù)據(jù)庫復(fù)制的原理
數(shù)據(jù)庫復(fù)制是在分布式數(shù)據(jù)庫系統(tǒng)中使用非常廣泛的技術(shù)。分布式數(shù)據(jù)庫系統(tǒng)由多個相同或不同的數(shù)據(jù)庫組成,它們通過局域網(wǎng)或廣域網(wǎng)相連,不同數(shù)據(jù)庫的數(shù)據(jù)之間有非常緊密的關(guān)系。在分布式數(shù)據(jù)庫系統(tǒng)中應(yīng)用可訪問本地和遠(yuǎn)程的數(shù)據(jù)庫,使用客戶服務(wù)器體系結(jié)構(gòu)處理信息請求。不同物理數(shù)據(jù)庫之間使用數(shù)據(jù)庫鏈路連接,使得客戶端對它們的訪問就象訪問一個邏輯數(shù)據(jù)庫一樣。分布式數(shù)據(jù)庫系統(tǒng)中各個數(shù)據(jù)庫協(xié)同工作,但每個數(shù)據(jù)庫節(jié)點(diǎn)是個獨(dú)立的數(shù)據(jù)庫,可由不同部門分別進(jìn)行管理和數(shù)據(jù)庫的升級,一個數(shù)據(jù)庫出現(xiàn)故障不會影響其它數(shù)據(jù)庫的使用。在分布式數(shù)據(jù)庫系統(tǒng)中的每個獨(dú)立的數(shù)據(jù)庫一般被稱為站點(diǎn)或數(shù)據(jù)庫站點(diǎn)。
在應(yīng)用中,采用數(shù)據(jù)庫復(fù)制的原因是需定期地將信息傳播出去,或定期地從某地獲得信息。
可以O(shè)racle數(shù)據(jù)庫為例來說明數(shù)據(jù)庫工作的基本原理。Oracle數(shù)據(jù)庫的復(fù)制是采用數(shù)據(jù)庫的后臺進(jìn)程自動實(shí)現(xiàn)的。負(fù)責(zé)復(fù)制工作的后臺進(jìn)程個數(shù)和它們被激活的時(shí)間是由數(shù)據(jù)庫參數(shù)確定的。數(shù)據(jù)庫的后臺進(jìn)程是由系統(tǒng)進(jìn)程進(jìn)行管理,經(jīng)過設(shè)定的時(shí)間間隔執(zhí)行它們預(yù)定的工作,以實(shí)現(xiàn)數(shù)據(jù)定期地從源站點(diǎn)到目標(biāo)站點(diǎn)的傳播。Oracle數(shù)據(jù)庫具有基本復(fù)制和高級復(fù)制方法。所謂基本復(fù)制是指從主表到復(fù)制點(diǎn)生成的數(shù)據(jù)是只讀的,用戶不能對復(fù)制生成的數(shù)據(jù)實(shí)施修改操作,這種實(shí)體被稱為快照??煺盏男畔⒉粩嗟匕凑赵O(shè)計(jì)時(shí)定義的時(shí)間間隔從主表進(jìn)行更新,間隔的設(shè)定可根據(jù)應(yīng)用對信息要求的實(shí)時(shí)性而定。高級復(fù)制相對基本復(fù)制而言各復(fù)制點(diǎn)都可對數(shù)據(jù)進(jìn)行修改,每個數(shù)據(jù)庫站點(diǎn)進(jìn)行的修改都可傳播到其它站點(diǎn),每個站點(diǎn)都可看到其它站點(diǎn)輸入或修改的數(shù)據(jù)。數(shù)據(jù)的一致性是采用高級復(fù)制時(shí)須全面考慮的問題。
數(shù)據(jù)庫的復(fù)制用途很大,但不同的應(yīng)用有不同的要求,Oracle提供的復(fù)制方法能滿足大多數(shù)的需要,但有的實(shí)際問題,如帶有統(tǒng)計(jì)匯總計(jì)算功能的復(fù)制,只有利用Oracle提供的思想方法自行開發(fā)復(fù)制軟件,將復(fù)制和匯總合二為一。理解了復(fù)制工作的基本原理后,自行開發(fā)復(fù)制軟件也就是輕而易舉的事了。
2 數(shù)據(jù)庫復(fù)制的用途
復(fù)制是在分布式數(shù)據(jù)庫系統(tǒng)中獲得多個數(shù)據(jù)庫信息的方法,如在部隊(duì)的數(shù)據(jù)庫系統(tǒng)中用于上級機(jī)關(guān)了解和獲得下屬各部隊(duì)的武器、彈藥、物資等的狀態(tài)情況的數(shù)據(jù)。還可用于沒條件一直處于連接的環(huán)境、信息的分布使用、信息匯總、提高性能、備份、平衡應(yīng)用的負(fù)載、大批數(shù)據(jù)傳輸?shù)?,如連鎖店的總店為了統(tǒng)一零售價(jià)格、及時(shí)將商品的價(jià)格發(fā)布給各零售店是非常重要的,為達(dá)到此目的,每個零售店的數(shù)據(jù)庫擁有價(jià)格列表的復(fù)制品,每天晚上從總店的主表更新,這是信息的分布使用的典型例子。大批數(shù)據(jù)傳輸主要用于從別的數(shù)據(jù)庫系統(tǒng)中導(dǎo)入數(shù)據(jù),如從聯(lián)機(jī)事務(wù)處理系統(tǒng)中將信息復(fù)制到?jīng)Q策支持系統(tǒng)中等。
一般說來,應(yīng)用只存取本地?cái)?shù)據(jù)庫的數(shù)據(jù),而限制對遠(yuǎn)程數(shù)據(jù)庫數(shù)據(jù)的存取,以減少網(wǎng)絡(luò)的負(fù)擔(dān),提高性能;另一方面,如果重要的數(shù)據(jù)已被復(fù)制到其它服務(wù)器,那么在本地服務(wù)器出現(xiàn)故障時(shí),系統(tǒng)仍然可用。使用復(fù)制技術(shù)還能提高數(shù)據(jù)庫存取的性能、數(shù)據(jù)的安全性和加強(qiáng)應(yīng)用的限制。
利用數(shù)據(jù)庫復(fù)制的方法有利于及時(shí)獲得最新信息,有利于減少用戶的重復(fù)勞動,有利于及時(shí)維護(hù)數(shù)據(jù)庫的一致性。
3 數(shù)據(jù)庫復(fù)制設(shè)計(jì)的基本步驟
數(shù)據(jù)庫復(fù)制的基本工作方式是,定義一個查詢,使用數(shù)據(jù)庫的作業(yè)管理機(jī)制,自動地、定期地從主表更新數(shù)據(jù)。
3.1 基本復(fù)制
基本復(fù)制的設(shè)計(jì)主要包括以下步驟:
(1)建立復(fù)制環(huán)境,確定哪些主表將被復(fù)制,復(fù)制到哪些站點(diǎn)的數(shù)據(jù)庫;
?。?)在復(fù)制的各站點(diǎn),建立復(fù)制用戶和復(fù)制的數(shù)據(jù)庫鏈路;
?。?)在被復(fù)制的數(shù)據(jù)庫中建立所有主表的更新日志,更新日志是支持快速更新的關(guān)鍵;
(4)在復(fù)制的各站點(diǎn),使用數(shù)據(jù)庫鏈路建立快照;
?。?)在復(fù)制的各站點(diǎn),建立快照的更新組,定義更新時(shí)間和更新間隔,將需同時(shí)更新的快照加入一個更新組中;
?。?)授予需使用快照的用戶對快照的查詢權(quán)限。
3.1.1 復(fù)制環(huán)境
在設(shè)計(jì)一個分布式數(shù)據(jù)庫系統(tǒng)時(shí),確定哪些主表將被復(fù)制,檢查每個參加復(fù)制的表,確認(rèn)每個表都有主鍵。確定每個表中哪些信息以什么形式復(fù)制到哪些站點(diǎn)的數(shù)據(jù)庫。將需復(fù)制的主表根據(jù)其數(shù)據(jù)關(guān)系、應(yīng)用關(guān)系、應(yīng)用對數(shù)據(jù)的實(shí)時(shí)性要求等進(jìn)行分組。
建議不同服務(wù)器中需復(fù)制的表在不同的數(shù)據(jù)庫位于相同的用戶名下,對應(yīng)的用戶采用相同的口令,以便于操作。而采用高級復(fù)制的具有數(shù)據(jù)復(fù)制關(guān)系的表的結(jié)構(gòu)在各站點(diǎn)應(yīng)一致。
3.1.2 建立用戶和數(shù)據(jù)庫鏈路
在參加復(fù)制的主站點(diǎn)和復(fù)制點(diǎn)建立對應(yīng)的用戶以包含復(fù)制對象。建立主表所在的數(shù)據(jù)庫到各復(fù)制站點(diǎn)的數(shù)據(jù)庫鏈路。雖然復(fù)制一般是在不同數(shù)據(jù)庫的相同用戶之間進(jìn)行,但建立數(shù)據(jù)庫鏈路時(shí)還是需顯式地指定連接的用戶名和口令。不要建立公共的數(shù)據(jù)庫鏈路,一般建立屬于直接連接的復(fù)制用戶的私有鏈路。
3.1.3 建立日志
日志是為了記錄對主表數(shù)據(jù)的輸入、更新、刪除操作,有了日志,系統(tǒng)可識別哪些數(shù)據(jù)是新產(chǎn)生的需要復(fù)制的數(shù)據(jù),哪些數(shù)據(jù)是已經(jīng)被復(fù)制過了的,因此每次更新只需復(fù)制那些最新的信息,以減少數(shù)據(jù)的復(fù)制量,降低網(wǎng)絡(luò)流量,縮短復(fù)制的時(shí)間。
在被復(fù)制的數(shù)據(jù)庫中建立所有主表的更新日志,更新日志只需建立一次即可支持一個站點(diǎn)到多個站點(diǎn)的復(fù)制。
3.1.4 建立快照
在每個復(fù)制站點(diǎn),建立所需的快照。復(fù)制端的快照的邏輯結(jié)構(gòu)是從一個或多個主表中進(jìn)行查詢的SQL語句定義的,同時(shí)該SQL語句也定義快照所含的來自主表的那部分信息,它不能包含合計(jì)、分組、連接、集合功能。
3.1.5 更新
根據(jù)對主表的分組情況在復(fù)制的各站點(diǎn)建立快照的更新組,根據(jù)需要定義更新時(shí)間和更新間隔,將需同時(shí)更新的快照加入一個更新組中。
必須設(shè)定怎樣和什么時(shí)候更新復(fù)制端的數(shù)據(jù)??蛇x用完全更新、快速更新、手工更新和自動更新方式。更新時(shí)間的設(shè)置需遵循以下原則:
·下次更新時(shí)間為未來時(shí)間;
·更新間隔大于完成一次更新所需時(shí)間;
·可指定一具體時(shí)間進(jìn)行手工更新。
出現(xiàn)網(wǎng)絡(luò)問題或系統(tǒng)錯誤時(shí),更新將暫時(shí)被中斷,一旦問題解決,更新將恢復(fù)正常。
3.1.6 權(quán)限
對于使用簡單復(fù)制方法生成的快照,只需授予用戶查詢權(quán)限,因?yàn)榭煺帐侵蛔x的;對于使用高級復(fù)制方法生成的復(fù)制品,可視需求設(shè)置不同權(quán)限,但由于權(quán)限越大,用戶可執(zhí)行的操作越多,產(chǎn)生復(fù)制沖突的可能性越大,因此權(quán)限還需有限制地授予。
3.2 高級復(fù)制
高級復(fù)制又分為多站點(diǎn)復(fù)制和可更新快照復(fù)制。其設(shè)計(jì)原理和步驟與基本復(fù)制相似,簡述如下。多站點(diǎn)復(fù)制包括以下步驟:
?。?)設(shè)計(jì)并建立復(fù)制環(huán)境,確定哪些站點(diǎn)作為高級復(fù)制的站點(diǎn),哪些主表將參與復(fù)制;
?。?)使用復(fù)制管理器,定義參加復(fù)制的站點(diǎn),在復(fù)制的各站點(diǎn),建立包含復(fù)制實(shí)體的用戶和復(fù)制的數(shù)據(jù)庫鏈路,建立復(fù)制的管理用戶,配置數(shù)據(jù)更新的計(jì)劃;
?。?)建立主復(fù)制組,不同的需參與復(fù)制的實(shí)體可加入不同的組中;
(4)授予需使用復(fù)制信息的用戶以適當(dāng)?shù)臋?quán)限。
可更新快照復(fù)制包括以下步驟:
?。?)設(shè)計(jì)并建立復(fù)制環(huán)境,確定哪些站點(diǎn)作為復(fù)制的主站點(diǎn),哪些主表和實(shí)體將參與復(fù)制,確定哪些為可更新快照的設(shè)置站點(diǎn);
?。?)在復(fù)制的各站點(diǎn)建立快照管理用戶,建立包含可更新快照實(shí)體的用戶和復(fù)制的數(shù)據(jù)庫鏈路,配置數(shù)據(jù)更新的時(shí)間和間隔;
(3)在主站點(diǎn)建立快照日志;
(4)在復(fù)制點(diǎn)建立必要的更新組;
(5)建立快照組,快照組可包含表、存儲過程、包、函數(shù)、同義詞、視圖等實(shí)體;
?。?)授予需使用復(fù)制信息的用戶以適當(dāng)?shù)臋?quán)限。
4 數(shù)據(jù)庫復(fù)制的設(shè)計(jì)
4.1 數(shù)據(jù)庫的分布
如何分布和設(shè)計(jì)數(shù)據(jù)庫需視具體工程應(yīng)用的地理分布、組織關(guān)系、數(shù)據(jù)量、資金和對數(shù)據(jù)的安全性等情況而定。
數(shù)據(jù)庫復(fù)制的設(shè)計(jì)要盡可能簡單,數(shù)據(jù)關(guān)系盡可能簡化,只要滿足需求即可。盡可能減少維護(hù)管理的工作量。
應(yīng)用存取頻繁的數(shù)據(jù)盡量位于本地?cái)?shù)據(jù)庫,如果這些數(shù)據(jù)由遠(yuǎn)程數(shù)據(jù)庫進(jìn)行管理,則需考慮將其復(fù)制到本地,這樣既可簡化應(yīng)用程序的設(shè)計(jì),又可提高數(shù)據(jù)的安全性、降低網(wǎng)絡(luò)流量、提高性能。如果應(yīng)用程序需要同時(shí)存取本地和遠(yuǎn)程的數(shù)據(jù)庫,設(shè)計(jì)時(shí)一定要通過事務(wù)的同時(shí)提交或回滾以保證數(shù)據(jù)的一致性。
如果采用高級復(fù)制,因?yàn)榭赡艹霈F(xiàn)多個站點(diǎn)同時(shí)修改或輸入相同數(shù)據(jù)的可能,所以數(shù)據(jù)復(fù)制需考慮的首要問題是數(shù)據(jù)沖突問題。設(shè)計(jì)中要盡可能避免數(shù)據(jù)沖突的產(chǎn)生。而設(shè)計(jì)時(shí)不可避免的數(shù)據(jù)沖突要在設(shè)計(jì)時(shí)確定解決方法,在運(yùn)行時(shí)將其配置于復(fù)制環(huán)境以利于在沖突產(chǎn)生時(shí)數(shù)據(jù)庫能及時(shí)解決問題,不致于影響整個復(fù)制的工作進(jìn)程。
4.2 數(shù)據(jù)沖突的解決
數(shù)據(jù)的沖突是設(shè)計(jì)人員設(shè)計(jì)分布式數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)庫復(fù)制時(shí)主要解決的問題,數(shù)據(jù)沖突主要出現(xiàn)在高級復(fù)制環(huán)境。
評論