揭秘:RCFile高效存儲(chǔ)結(jié)構(gòu)
本文介紹了Facebook公司數(shù)據(jù)分析系統(tǒng)中的RCFile存儲(chǔ)結(jié)構(gòu),該結(jié)構(gòu)集行存儲(chǔ)和列存儲(chǔ)的優(yōu)點(diǎn)于一身,在MapReduce環(huán)境下的大規(guī)模數(shù)據(jù)分析中扮演重要角色。
本文引用地址:http://m.butianyuan.cn/article/150786.htmFacebook曾在2010 ICDE(IEEE International Conference on Data Engineering)會(huì)議上介紹了數(shù)據(jù)倉(cāng)庫(kù)Hive。Hive存儲(chǔ)海量數(shù)據(jù)在Hadoop系統(tǒng)中,提供了一套類(lèi)數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)和處理機(jī)制。它采用類(lèi)SQL語(yǔ)言對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化管理和處理,經(jīng)過(guò)語(yǔ)句解析和轉(zhuǎn)換,最終生成基于Hadoop的MapReduce任務(wù),通過(guò)執(zhí)行這些任務(wù)完成數(shù)據(jù)處理。圖1顯示了Hive數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)結(jié)構(gòu)。
圖1 Hive數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)結(jié)構(gòu)
基于MapReduce的數(shù)據(jù)倉(cāng)庫(kù)在超大規(guī)模數(shù)據(jù)分析中扮演了重要角色,對(duì)于典型的Web服務(wù)供應(yīng)商,這些分析有助于它們快速理解動(dòng)態(tài)的用戶(hù)行為及變化的用戶(hù)需求。數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)是影響數(shù)據(jù)倉(cāng)庫(kù)性能的關(guān)鍵因素之一。Hadoop系統(tǒng)中常用的文件存儲(chǔ)格式有支持文本的TextFile和支持二進(jìn)制的SequenceFile等,它們都屬于行存儲(chǔ)方式。Facebook工程師發(fā)表的RCFile: A Fast and Spaceefficient Data Placement Structure in MapReducebased Warehouse Systems一文,介紹了一種高效的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)——RCFile(Record Columnar File),并將其應(yīng)用于Facebook的數(shù)據(jù)倉(cāng)庫(kù)Hive中。與傳統(tǒng)數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)相比,RCFile更有效地滿(mǎn)足了基于MapReduce的數(shù)據(jù)倉(cāng)庫(kù)的四個(gè)關(guān)鍵需求,即Fast data loading、Fast query processing、Highly efficient storage space utilization和Strong adaptivity to highly dynamic workload patterns。
數(shù)據(jù)倉(cāng)庫(kù)的需求
基于Facebook系統(tǒng)特征和用戶(hù)數(shù)據(jù)的分析,在MapReduce計(jì)算環(huán)境下,數(shù)據(jù)倉(cāng)庫(kù)對(duì)于數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)有四個(gè)關(guān)鍵需求。
Fast data loading
對(duì)于Facebook的產(chǎn)品數(shù)據(jù)倉(cāng)庫(kù)而言,快速加載數(shù)據(jù)(寫(xiě)數(shù)據(jù))是非常關(guān)鍵的。每天大約有超過(guò)20TB的數(shù)據(jù)上傳到Facebook的數(shù)據(jù)倉(cāng)庫(kù),由于數(shù)據(jù)加載期間網(wǎng)絡(luò)和磁盤(pán)流量會(huì)干擾正常的查詢(xún)執(zhí)行,因此縮短數(shù)據(jù)加載時(shí)間是非常必要的。
Fast query processing
為了滿(mǎn)足實(shí)時(shí)性的網(wǎng)站請(qǐng)求和支持高并發(fā)用戶(hù)提交查詢(xún)的大量讀負(fù)載,查詢(xún)響應(yīng)時(shí)間是非常關(guān)鍵的,這要求底層存儲(chǔ)結(jié)構(gòu)能夠隨著查詢(xún)數(shù)量的增加而保持高速的查詢(xún)處理。
Highly efficient storage space utilization
高速增長(zhǎng)的用戶(hù)活動(dòng)總是需要可擴(kuò)展的存儲(chǔ)容量和計(jì)算能力,有限的磁盤(pán)空間需要合理管理海量數(shù)據(jù)的存儲(chǔ)。實(shí)際上,該問(wèn)題的解決方案就是最大化磁盤(pán)空間利用率。
Strong adaptivity to highly dynamic workload patterns
同一份數(shù)據(jù)集會(huì)供給不同應(yīng)用的用戶(hù),通過(guò)各種方式來(lái)分析。某些數(shù)據(jù)分析是例行過(guò)程,按照某種固定模式周期性執(zhí)行;而另一些則是從中間平臺(tái)發(fā)起的查詢(xún)。大多數(shù)負(fù)載不遵循任何規(guī)則模式,這需要底層系統(tǒng)在存儲(chǔ)空間有限的前提下,對(duì)數(shù)據(jù)處理中不可預(yù)知的動(dòng)態(tài)數(shù)據(jù)具備高度的適應(yīng)性,而不是專(zhuān)注于某種特殊的負(fù)載模式。
MapReduce存儲(chǔ)策略
要想設(shè)計(jì)并實(shí)現(xiàn)一種基于MapReduce數(shù)據(jù)倉(cāng)庫(kù)的高效數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),關(guān)鍵挑戰(zhàn)是在MapReduce計(jì)算環(huán)境中滿(mǎn)足上述四個(gè)需求。在傳統(tǒng)數(shù)據(jù)庫(kù)系統(tǒng)中,三種數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)被廣泛研究,分別是行存儲(chǔ)結(jié)構(gòu)、列存儲(chǔ)結(jié)構(gòu)和PAX混合存儲(chǔ)結(jié)構(gòu)。上面這三種結(jié)構(gòu)都有其自身特點(diǎn),不過(guò)簡(jiǎn)單移植這些數(shù)據(jù)庫(kù)導(dǎo)向的存儲(chǔ)結(jié)構(gòu)到基于MapReduce的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)并不能很好地滿(mǎn)足所有需求。
行存儲(chǔ)
如圖2所示,基于Hadoop系統(tǒng)行存儲(chǔ)結(jié)構(gòu)的優(yōu)點(diǎn)在于快速數(shù)據(jù)加載和動(dòng)態(tài)負(fù)載的高適應(yīng)能力,這是因?yàn)樾写鎯?chǔ)保證了相同記錄的所有域都在同一個(gè)集群節(jié)點(diǎn),即同一個(gè)HDFS塊。不過(guò),行存儲(chǔ)的缺點(diǎn)也是顯而易見(jiàn)的,例如它不能支持快速查詢(xún)處理,因?yàn)楫?dāng)查詢(xún)僅僅針對(duì)多列表中的少數(shù)幾列時(shí),它不能跳過(guò)不必要的列讀取;此外,由于混合著不同數(shù)據(jù)值的列,行存儲(chǔ)不易獲得一個(gè)極高的壓縮比,即空間利用率不易大幅提高。盡管通過(guò)熵編碼和利用列相關(guān)性能夠獲得一個(gè)較好的壓縮比,但是復(fù)雜數(shù)據(jù)存儲(chǔ)實(shí)現(xiàn)會(huì)導(dǎo)致解壓開(kāi)銷(xiāo)增大。
圖2 HDFS塊內(nèi)行存儲(chǔ)的例子
評(píng)論