盡管創(chuàng)建元數(shù)據(jù)源的副本《抽取文件)會(huì)有一些額外的存儲(chǔ)r丌銷,但這些開銷會(huì)相當(dāng)小,因?yàn)樵獢?shù)據(jù)源文件中的數(shù)據(jù)量通常不會(huì)很大。另一方面,單獨(dú)建立抽取層有三個(gè)優(yōu)點(diǎn):
1)時(shí)效性
抽取層對(duì)于保持系統(tǒng)中的元數(shù)據(jù)同步非常重要。為了說(shuō)明這一點(diǎn),可以假定有三張?jiān)獢?shù)據(jù)倉(cāng)庫(kù)表需要從相同的元數(shù)據(jù)源得至0數(shù)據(jù)。如何構(gòu)造一個(gè)進(jìn)程直接從同一數(shù)據(jù)源構(gòu)建這三張?jiān)獢?shù)據(jù)表,當(dāng)執(zhí)行該迸程來(lái)構(gòu)建其中一元數(shù)據(jù)表時(shí),此時(shí)的元數(shù)據(jù)源可能已經(jīng)變化了。當(dāng)元數(shù)據(jù)源高度動(dòng)態(tài)變化時(shí),這種情況的可能性會(huì)更大。在不同時(shí)刻讀取元數(shù)據(jù)時(shí),元數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)就會(huì)不同步。通過在集成處理過程中一次性創(chuàng)建抽取文件,所有的元數(shù)據(jù)表可由該抽取文件構(gòu)建,這就消除了可能的時(shí)效性問題。
2)擴(kuò)展性
因?yàn)橐獎(jiǎng)?chuàng)建類似于元數(shù)據(jù)源文件或表的抽取文件,所以只需要從元數(shù)據(jù)源一次性地讀取數(shù)據(jù)。如果沒有抽取文件或表,元數(shù)據(jù)倉(cāng)庫(kù)中的每張表都必須分別從元數(shù)據(jù)源中讀取,這并不是開發(fā)人員所期望的。
3)備份
創(chuàng)建抽取文件提供了該元數(shù)據(jù)源的自然備份。因此,如果出現(xiàn)了不得不停止元數(shù)據(jù)集成處理的狀況,那么可以在不影響元數(shù)據(jù)源的情況下輕易地撤消改動(dòng)。