多核系統(tǒng)效率與任務(wù)屬性關(guān)系的優(yōu)化策略

作者：時(shí)間：2013-11-06 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

多核CPU支持的緊耦合并行結(jié)構(gòu)對(duì)面向移動(dòng)計(jì)算或高性能計(jì)算機(jī)(HPC)系統(tǒng)的技術(shù)支持是時(shí)下業(yè)界研究的熱點(diǎn)。然而，并行體系結(jié)構(gòu)設(shè)計(jì)與應(yīng)用表明：系統(tǒng)的并行處理能力與系統(tǒng)的整體效率不一定成正比。對(duì)于確定的任務(wù)，計(jì)算量增加，系統(tǒng)效率可能下降[1]。所以，在引入多核結(jié)構(gòu)提升系統(tǒng)并行處理能力過(guò)程中，充分考慮系統(tǒng)所處理任務(wù)的屬性是獲得高系統(tǒng)效率的關(guān)鍵因素之一。

人們?cè)谧非笥?jì)算機(jī)高速度運(yùn)行、高可靠性的今天，更加注重系統(tǒng)效率[2-3]。尤其是摩爾定理遇到瓶頸時(shí)，驅(qū)動(dòng)了多核CPU設(shè)計(jì)，同時(shí)基于多核的并行程序設(shè)計(jì)也隨之成為研究熱點(diǎn)，多核并行硬件和軟件協(xié)調(diào)進(jìn)步仍然延續(xù)著ENIAC以來(lái)的相輔相成發(fā)展的技術(shù)路線，成為新概念上的研究領(lǐng)域。

對(duì)計(jì)算機(jī)性能準(zhǔn)確建模非常復(fù)雜[4]，其中最基本的因素包括存儲(chǔ)器層次結(jié)構(gòu)、操作系統(tǒng)、互聯(lián)網(wǎng)絡(luò)、處理機(jī)技術(shù)、高速緩存與存儲(chǔ)管理、延遲包容或吸收機(jī)制、算法設(shè)計(jì)與編程語(yǔ)言等。然而，這些技術(shù)細(xì)節(jié)僅僅源自計(jì)算機(jī)系統(tǒng)本身，而隨著非科學(xué)計(jì)算的處理任務(wù)日趨顯現(xiàn)(如流媒體處理、模式識(shí)別、圖像處理、知識(shí)發(fā)現(xiàn)、多媒體庫(kù)操作等)，傳統(tǒng)的并行處理機(jī)制與結(jié)構(gòu)所追求的并行能力指標(biāo)將不再適應(yīng)新屬性任務(wù)處理，研究任務(wù)屬性與系統(tǒng)效率或整體性能，將成為并行處理體系結(jié)構(gòu)設(shè)計(jì)與應(yīng)用的重要課題。

1 并行系統(tǒng)的并行能力與效率描述

在研究并行處理技術(shù)過(guò)程中，因?yàn)閂on Neumann機(jī)的存儲(chǔ)程序結(jié)構(gòu)及系統(tǒng)的整體處理能力，取決于系統(tǒng)的全部處理節(jié)點(diǎn)或多核訪問(wèn)內(nèi)存的機(jī)制與效率[2]。所以，當(dāng)代典型的并行機(jī)系統(tǒng)都重點(diǎn)研究訪問(wèn)內(nèi)存的技術(shù)與方法。

1.1 幾種典型的并行機(jī)系統(tǒng)

當(dāng)前典型的并行機(jī)系統(tǒng)有共享存儲(chǔ)的對(duì)稱多處理機(jī)SMP(Symmetric Multi-Processor)、大規(guī)模并行處理機(jī)MPP(Massively Parallel Processor)、分布式共享存儲(chǔ)器多處理機(jī)DSM(Distributed Shared Memory)、工作站機(jī)群COW(Cluster of Workstations)和跨地域性的、用高速網(wǎng)絡(luò)將異構(gòu)性計(jì)算節(jié)點(diǎn)連接起來(lái)滿足用戶分布式計(jì)算要求的網(wǎng)格計(jì)算環(huán)境GCE(Grid Computational Environment)。

1.2 并行計(jì)算機(jī)訪存模型

均勻存儲(chǔ)訪問(wèn)模型(Uniform Memory Access)，其重要特征是物理存儲(chǔ)器被所有處理器均勻共享，所有處理器訪問(wèn)任何存儲(chǔ)字的時(shí)間相同；每臺(tái)處理器都帶私有高速緩存，外圍設(shè)備也可以一定形式共享。也稱為緊耦合系統(tǒng)(Tightly Coupled System)。當(dāng)所有處理器都能等同地訪問(wèn)所有I/O設(shè)備、能同樣地運(yùn)行程序(如操作系統(tǒng)內(nèi)核、I/O服務(wù)程序等)時(shí)，稱為對(duì)稱多處理機(jī)(SMP)。

非均勻存儲(chǔ)訪問(wèn)模型(Non-uniform Memory Access)，所共享的存儲(chǔ)器在物理上是分布在所有的處理機(jī)中，其所有本地存儲(chǔ)器的集合就組成了全局地址空間。處理器訪問(wèn)存儲(chǔ)器的時(shí)間不一樣，訪問(wèn)本地存儲(chǔ)器LM或群內(nèi)共享存儲(chǔ)器CSM較快，而訪問(wèn)外地存儲(chǔ)器或全局共享存儲(chǔ)器GSM(Global Share Memory)較慢。每臺(tái)處理器照例可帶私有高速緩存，外設(shè)也可以某種形式共享。

全高速緩存存儲(chǔ)訪問(wèn)模型(Cache-Only Memory Access)，各處理器節(jié)點(diǎn)中沒(méi)有存儲(chǔ)層次結(jié)構(gòu)，全部高速緩存組成了全局地址空間。利用分布的高速緩存目錄D進(jìn)行遠(yuǎn)程高速緩存的訪問(wèn)，緩存容量一般都大于二級(jí)高速緩存容量。數(shù)據(jù)開始可任意分配，隨著進(jìn)程的推進(jìn)，數(shù)據(jù)最終被遷移到相應(yīng)存儲(chǔ)空間。

高速緩存一致性非均勻存儲(chǔ)訪問(wèn)模型(Cache-Coherent Non-uniform Memory Access)，絕大多數(shù)商用系統(tǒng)都使用基于目錄的高速緩存一致性協(xié)議，比較SMP優(yōu)化了可擴(kuò)展性，是一種分布共享存儲(chǔ)的多處理機(jī)系統(tǒng)。隨著進(jìn)程推進(jìn)，數(shù)據(jù)自遷移到所用的空間。

非遠(yuǎn)程存儲(chǔ)訪問(wèn)模型(No-Remote Memory Access)，所有存儲(chǔ)器是私有的，不支持遠(yuǎn)程存儲(chǔ)器訪問(wèn)。

1.3 系統(tǒng)加速比與效率

多處理器加速比和處理機(jī)效率可分別表示為：

因?yàn)樽罴鸭铀俦仁蔷€性的，即：SP=Op，所以最佳效率就是常數(shù)，即：E＝Const (0≤Const≤1)。

　　由(1)式知，P增加，則E下降，但能夠通過(guò)優(yōu)化算法使E增加。當(dāng)然是增加了算法優(yōu)化過(guò)程的工作量(Workload)，即由于付出Workload開銷，在系統(tǒng)處理機(jī)數(shù)量增加時(shí)維持系統(tǒng)效率不變。這就是本文提出的基于任務(wù)屬性分析結(jié)果，科學(xué)地選擇多核系統(tǒng)結(jié)構(gòu)的概念。所以，始終保持一定效率常數(shù)的優(yōu)化系統(tǒng)，應(yīng)該能夠?qū)崟r(shí)對(duì)系統(tǒng)內(nèi)參與運(yùn)行的處理機(jī)數(shù)量實(shí)現(xiàn)科學(xué)調(diào)度，這等同于大規(guī)模作戰(zhàn)系統(tǒng)的指揮，必須科學(xué)地調(diào)兵遣將。

2 指令級(jí)并行與多核CPU

實(shí)現(xiàn)指令級(jí)并行(ILP)處理的基本要求是被執(zhí)行指令序列不存在指令與數(shù)據(jù)相關(guān)，系統(tǒng)能在同一絕對(duì)時(shí)間或相對(duì)時(shí)間內(nèi)并行執(zhí)行多個(gè)任務(wù)指令或線程，現(xiàn)代多核CPU能支持片內(nèi)多線程平行推進(jìn)。如果任務(wù)的指令序列存在相關(guān)性，平行推進(jìn)過(guò)程將出現(xiàn)“參差不齊”或線程暫停而阻塞相關(guān)核的運(yùn)行線程現(xiàn)象。所以，需要事先找出指令代碼中合適的指令序列段(S)，如果執(zhí)行S的時(shí)鐘周期能正好等于原來(lái)被阻塞的延遲時(shí)間(Delay)，則能有效地緩沖或吸收線程阻塞，繼續(xù)維持多核的多線程平行推進(jìn)。

現(xiàn)代多核CPU實(shí)際上引入了多線程平行推進(jìn)過(guò)程中自適應(yīng)進(jìn)程遷移技術(shù)，即當(dāng)某核的線程被阻塞時(shí)，能自動(dòng)完成相應(yīng)線程上的進(jìn)程段遷移，相當(dāng)于上述執(zhí)行S而吸收線程阻塞。

新聞中心

多核系統(tǒng)效率與任務(wù)屬性關(guān)系的優(yōu)化策略

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)