博客專欄

EEPW首頁(yè) > 博客 > 嵌入式Linux:空洞文件

嵌入式Linux:空洞文件

發(fā)布人:美男子玩編程 時(shí)間:2024-04-24 來(lái)源:工程師 發(fā)布文章

空洞文件(Sparse File)是一種在磁盤(pán)上并非完全分配存儲(chǔ)空間的文件。它包含了一些邏輯上存在但物理上并未存儲(chǔ)的數(shù)據(jù)。


空洞文件在多線程共同操作文件時(shí)具有極大的優(yōu)勢(shì)。當(dāng)創(chuàng)建一個(gè)巨大的文件時(shí),單個(gè)線程逐步構(gòu)建文件會(huì)耗費(fèi)大量時(shí)間。一種優(yōu)化思路是將文件劃分為多個(gè)段,利用多線程同時(shí)操作,每個(gè)線程負(fù)責(zé)寫(xiě)入其中一段數(shù)據(jù)。這類似于現(xiàn)實(shí)生活中修路的場(chǎng)景,如修建高速公路時(shí),單個(gè)施工隊(duì)的進(jìn)度可能較慢,但通過(guò)安排多個(gè)施工隊(duì),每個(gè)隊(duì)負(fù)責(zé)修建一段,最終將它們連接起來(lái),大大提高了效率。


空洞文件在實(shí)際應(yīng)用中有兩個(gè)典型場(chǎng)景:

1、在使用迅雷下載文件時(shí),尚未完全下載時(shí)文件已經(jīng)占據(jù)整個(gè)文件大小的空間,這就是空洞文件的應(yīng)用。如果沒(méi)有空洞文件,多線程下載時(shí)只能從一個(gè)位置寫(xiě)入,無(wú)法充分發(fā)揮多線程的優(yōu)勢(shì)。有了空洞文件,不同地址可以同時(shí)寫(xiě)入,發(fā)揮了多線程的優(yōu)勢(shì)。

2、在創(chuàng)建虛擬機(jī)時(shí),如果一開(kāi)始就分配了100GB的磁盤(pán)空間,而實(shí)際上系統(tǒng)安裝完成后可能只使用了3、4GB的空間,這就是空洞文件的應(yīng)用。通過(guò)空洞文件,可以避免一開(kāi)始就分配過(guò)多的資源,節(jié)約了存儲(chǔ)空間的浪費(fèi)。


在 Linux 中,可以通過(guò)使用 lseek 和 write 系統(tǒng)調(diào)用來(lái)創(chuàng)建空洞文件。以下是一個(gè)簡(jiǎn)單的例子:



































#include #include #include 
int main(void) {    // 打開(kāi)或創(chuàng)建一個(gè)文件(如果不存在)    int fd = open("sparse_file.txt", O_WRONLY | O_CREAT, 0666);    if (fd == -1) {        perror("open");        return 1;    }
    // 將文件指針移動(dòng)到第 1024 個(gè)字節(jié)處    if (lseek(fd, 1024, SEEK_SET) == -1) {        perror("lseek");        close(fd);        return 1;    }
    // 寫(xiě)入一個(gè)字節(jié)數(shù)據(jù)到文件(創(chuàng)建空洞)    if (write(fd, "A", 1) == -1) {        perror("write");        close(fd);        return 1;    }
    // 關(guān)閉文件    close(fd);
    printf("Sparse file created successfully.n");
    return 0;}


在這個(gè)例子中,通過(guò) lseek 將文件指針移動(dòng)到第 1024 個(gè)字節(jié)處,然后使用 write 寫(xiě)入一個(gè)字節(jié)的數(shù)據(jù)。由于文件指針跳過(guò)的區(qū)域并未實(shí)際寫(xiě)入數(shù)據(jù),因此在磁盤(pán)上創(chuàng)建了一個(gè)空洞。


可以使用 du 命令查看文件占用的磁盤(pán)空間,以驗(yàn)證是否為稀疏文件。例如:



du -h sparse_file.txt


這將顯示文件的磁盤(pán)使用情況,如果文件是空洞文件,它會(huì)顯示實(shí)際使用的磁盤(pán)空間較小。


在文件系統(tǒng)中,讀取空洞文件時(shí),操作系統(tǒng)會(huì)將空洞部分的數(shù)據(jù)補(bǔ)充為0,使得讀取的文件內(nèi)容包含完整的文件大小。


舉例說(shuō)明:如果一個(gè)文件大小為1GB,但只有其中的100MB是實(shí)際寫(xiě)入數(shù)據(jù),其余部分是空洞,讀取該文件時(shí),系統(tǒng)會(huì)自動(dòng)將空洞的部分填充為0,以確保讀取的文件內(nèi)容總大小為1GB。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: 嵌入式 Linux

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉