快速了解數(shù)據(jù)倉(cāng)庫及數(shù)據(jù)建模的常用新術(shù)語
數(shù)據(jù)倉(cāng)庫
數(shù)據(jù)倉(cāng)庫是一個(gè)支持管理決策的數(shù)據(jù)集合。數(shù)據(jù)是面向主題的、集成的、不易丟失的并且是時(shí)間變量。
數(shù)據(jù)倉(cāng)庫是所有操作環(huán)境和外部數(shù)據(jù)源的快照集合。它并不需要非常精確,因?yàn)樗仨氃谔囟ǖ臅r(shí)間基礎(chǔ)上從操作環(huán)境中提取出來。
數(shù)據(jù)集市
數(shù)據(jù)倉(cāng)庫只限于單個(gè)主題的區(qū)域,例如顧客、部門、地點(diǎn)等。數(shù)據(jù)集市在從數(shù)據(jù)倉(cāng)庫獲取數(shù)據(jù)時(shí)可以依賴于數(shù)據(jù)倉(cāng)庫,或者當(dāng)它們從操作系統(tǒng)中獲取數(shù)據(jù)時(shí)就不依賴于數(shù)據(jù)倉(cāng)庫。
事實(shí)
事實(shí)是數(shù)據(jù)倉(cāng)庫中的信息單元,也是多維空間中的一個(gè)單元,受分析單元的限制。
事實(shí)存儲(chǔ)于一張表中(當(dāng)使用關(guān)系數(shù)據(jù)庫時(shí))或者是多維數(shù)據(jù)庫中的一個(gè)單元。
每個(gè)事實(shí)包括關(guān)于事實(shí)(收入、價(jià)值、滿意記錄等)的基本信息,并且與維度相關(guān)。
在某些情況下,當(dāng)所有的必要信息都存儲(chǔ)于維度中時(shí),單純的事實(shí)出現(xiàn)就是對(duì)于數(shù)據(jù)倉(cāng)庫足夠的信息。我們稍后討論有關(guān)缺無事實(shí)的情況。
維度
維度是綁定由坐標(biāo)系定義的空間的坐標(biāo)系的軸線。數(shù)據(jù)倉(cāng)庫中的坐標(biāo)系定義了數(shù)據(jù)單元,其中包含事實(shí)。
坐標(biāo)系的一個(gè)例子就是帶有 x 維度和 y 維度的 Cartesian(笛卡爾)坐標(biāo)系。
在數(shù)據(jù)倉(cāng)庫中,時(shí)間總是維度之一。
數(shù)據(jù)挖掘
在數(shù)據(jù)倉(cāng)庫的數(shù)據(jù)中發(fā)現(xiàn)新信息的過程被稱為數(shù)據(jù)挖掘,這些新信息不會(huì)從操作系統(tǒng)中獲得。
分析空間
分析空間是數(shù)據(jù)倉(cāng)庫中一定量的數(shù)據(jù),用于進(jìn)行數(shù)據(jù)挖掘以發(fā)現(xiàn)新信息同時(shí)支持管理決策。
切片
一種用來在數(shù)據(jù)倉(cāng)庫中將一個(gè)維度中的分析空間限制為數(shù)據(jù)子集的技術(shù)。
切塊
一種用來在數(shù)據(jù)倉(cāng)庫中將多個(gè)維度中的分析空間限制為數(shù)據(jù)子集的技術(shù)。
星型模式
一種使用關(guān)系數(shù)據(jù)庫實(shí)現(xiàn)多維分析空間的模式,稱為星型模式。
星型模式將在本白皮書中稍后進(jìn)行進(jìn)一步討論。
雪花模式
不管什么原因,當(dāng)星型模式的維度需要進(jìn)行規(guī)范化時(shí),星型模式就演進(jìn)為雪花模式。
評(píng)論