(1)數(shù)據(jù)源:數(shù)據(jù)源可以是企業(yè)日常運(yùn)作積累下來的各類的業(yè)務(wù)數(shù)據(jù),也可以是外部的數(shù)據(jù)。數(shù)據(jù)倉庫的體系結(jié)構(gòu)必須能處理這種多樣性帶來的種種問題,并解決由于數(shù)據(jù)遠(yuǎn)程遷移所帶來的完整性和安全性的問題。
(2)數(shù)據(jù)抽取、轉(zhuǎn)換和裝載(ETL):從源數(shù)據(jù)抽取數(shù)據(jù)、進(jìn)行一定的變換、裝載到數(shù)據(jù)倉庫。需要進(jìn)行數(shù)據(jù)處理,包括:簡單變換——一次只針對一個(gè)字段,而不是考慮相關(guān)字段的值;清潔和刷洗——為了保證前后一致地格式化和使用某一字段或相關(guān)的字段群,檢查字段和字段組中的實(shí)際內(nèi)容而不僅是存儲(chǔ)格式;集成——要把從全然不同來源的數(shù)據(jù)結(jié)合在一起,真正的困難在于將其集成為一個(gè)緊密結(jié)合的數(shù)據(jù)模型;聚集和概括——按照一個(gè)和幾個(gè)業(yè)務(wù)維將相近的數(shù)值加在一起,聚集是將不同業(yè)務(wù)元素加在一起成為一個(gè)公共總數(shù),在數(shù)據(jù)倉庫中它們是以相同的方式進(jìn)行的。
(3)數(shù)據(jù)倉庫:數(shù)據(jù)倉庫的一個(gè)目的就是把企業(yè)的信息訪問基礎(chǔ)從一種非結(jié)構(gòu)化的或發(fā)展中的環(huán)境改變成一種結(jié)構(gòu)化或規(guī)劃良好的環(huán)境。
(4)數(shù)據(jù)集市:數(shù)據(jù)集市是為部門范圍級別的決策支持應(yīng)用而設(shè)計(jì)的,其數(shù)據(jù)模型設(shè)計(jì)和數(shù)據(jù)組織上更多地服務(wù)于一個(gè)部門的信息需求。
(5)操作型數(shù)據(jù)存儲(chǔ)區(qū):操作型數(shù)據(jù)存儲(chǔ)區(qū)(OperationalDataStore,ODS)是業(yè)務(wù)系統(tǒng)和DW之間更偏向業(yè)務(wù)系統(tǒng)的數(shù)據(jù)存儲(chǔ)區(qū)域。
(6)元數(shù)據(jù):元數(shù)據(jù)(Meta-data)通常定義為“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,是描述和管理數(shù)據(jù)倉庫自身內(nèi)容對象、用來表示數(shù)據(jù)項(xiàng)的意義及其在系統(tǒng)各組成部件之間的關(guān)系的數(shù)據(jù)。數(shù)據(jù)倉庫所提供的“統(tǒng)一的企業(yè)級的信息視圖”能力,主要就是靠元數(shù)據(jù)來體現(xiàn)。實(shí)現(xiàn)元數(shù)據(jù)管理的主要目標(biāo)就是使企業(yè)內(nèi)部元數(shù)據(jù)的定義標(biāo)準(zhǔn)化。數(shù)據(jù)倉庫的維護(hù)工具可以根據(jù)元數(shù)據(jù)完成數(shù)據(jù)的抽取、清洗和轉(zhuǎn)換,并做適度的匯總,數(shù)據(jù)倉庫的元數(shù)據(jù)包括:
①數(shù)據(jù)資源:包括數(shù)據(jù)源模型,描述源數(shù)據(jù)屬性及業(yè)務(wù)含義,源數(shù)據(jù)到數(shù)據(jù)倉庫的映射關(guān)系;
②數(shù)據(jù)組織:數(shù)據(jù)倉庫、數(shù)據(jù)集市表的結(jié)構(gòu)、屬性及業(yè)務(wù)含義,多維結(jié)構(gòu)等;③數(shù)據(jù)應(yīng)用:查詢與報(bào)表輸出格式描述、OLAP、數(shù)據(jù)挖掘等的數(shù)據(jù)模型的信息展現(xiàn)、商業(yè)術(shù)語;④數(shù)據(jù)管理:數(shù)據(jù)倉庫操作過程以及數(shù)據(jù)倉庫操作結(jié)果的模型,包括描述數(shù)據(jù)抽取和清洗規(guī)則,數(shù)據(jù)加載控制,臨時(shí)表結(jié)構(gòu)、用途和使用情況,數(shù)據(jù)匯總控制。(7)前端應(yīng)用:數(shù)據(jù)倉庫的前端應(yīng)用是建立數(shù)據(jù)倉庫的目的,即根據(jù)用戶的特點(diǎn)提供不同的界面。最終用戶對數(shù)據(jù)倉庫的訪問方式包括:即席查詢、報(bào)表、聯(lián)機(jī)分析處理(OLAP)、數(shù)據(jù)挖掘以及領(lǐng)導(dǎo)信息系統(tǒng)(EIS)等。
信息發(fā)布:廣州名易軟件有限公司 http://www.jetlc.com