多核與多線程技術的區(qū)別到底在哪里?
雖然兩詞到處可見,但可有人知此二者的實際差異?在執(zhí)行設計時又是以何者為重?到底是該多核優(yōu)先還是多線程提前?關于此似乎大家都想進一步了解,本文以下試圖對此進行個中差異的解說,并盡可能在不涉及實際復雜細節(jié)的情形下,讓各位對兩者的機制觀念與差別性有所理解。
行程早于線程
若依據信息技術的發(fā)展歷程,在軟件程序執(zhí)行時的再細分、再切割的小型化單位上,先是有行程(Process),之后才有線程(Thread),線程的單位比行程更小,一個行程內可以有多個線程,在一個行程下的各線程,都是共享同一個行程所建立的內存尋址資源及內存管理機制,包括執(zhí)行權階、內存空間、堆棧位置等,除此之外各個線程自身僅擁有少許因為執(zhí)行之需的變量自屬性,其余都依據與遵行行程所設立的規(guī)定。
相對的,程序與程序之間所用的就是不同的內存設定,包括分頁、分段等起始地址的不同,執(zhí)行權階的不同,堆棧深度的不同等,一顆處理器若執(zhí)行了A行程后要改去執(zhí)行B行程,對此必須進行內存管理組態(tài)的搬遷、變更,而這個搬遷若是在處理器內還好,若是在高速緩存甚至是系統(tǒng)主存儲器時,此種切換、轉移程序對執(zhí)行效能的損傷就非常大,因為完成搬遷、切換程序的相同時間,處理器早就可以執(zhí)行數十到上千個指令。
兩種路線的加速思維
所以,想避免此種切換的效率損耗,可以從兩種角度去思考,第一種思考就是擴大到整體運算系統(tǒng)的層面來解決,在 一部計算機內設計、配置更多顆的處理器,然后由同一個操作系統(tǒng)同時掌控及管理多顆處理器,并將要執(zhí)行的程序的各個程序,一個程序喂(也稱:發(fā)派)給一顆處理器去執(zhí)行,如此多顆同時執(zhí)行,每顆處理器執(zhí)行一個程序,如此就可以加快整體的執(zhí)行效率。
當然!這種加速方式必須有一個先決條件,即是操作系統(tǒng)在編譯時就必須能管控、發(fā)揮及運用多行程技術,倘若以單行程的系統(tǒng)組態(tài)來編譯,那么操作系統(tǒng)就無法管控服務器內一顆以上的處理器,如此就不用去談論由操作系統(tǒng)負責讓應用程序的程序進行同時的多顆同時性的執(zhí)行派送。
即便操作系統(tǒng)支持多程序,而應用程序若依舊只支持單程序,那情形一樣是白搭,操作系統(tǒng)無法對單行程程序再行拆分,依然是只喂入單一顆處理器上去執(zhí)行,無從加速。
同時用多顆處理器來執(zhí)行,且每顆處理器執(zhí)行一個行程,這是一種加速法,另一種加速法則是:盡量不進行內存管理組態(tài)的切換,避免切換的效能折損,線程正是在此概念下所出現(xiàn)的產物。
不過,線程也要程序的搭配才能發(fā)揮,線程的概念出現(xiàn)與落實已是“C++看消、Java看長”的階段,所以C++只能通過API呼用的方式來支持與使用多線程,如此必須改寫過往的程序才行,改寫成有呼用到支持多線程的API才行。相對的,較C++晚問世的Java則是原生支持多線程,不用改寫也能發(fā)揮及運用多線程的特性及其加速效益。
有了線程后,執(zhí)行的分割、切割更加細膩,線程機制不僅在多顆處理器的系統(tǒng)內可以加速,在單顆處理器內也一樣能獲得好處,在多顆處理器的系統(tǒng)上每顆處理器不僅可以單獨執(zhí)行一個程序,當然也可以單獨執(zhí)行一個線程,而在單處理器系統(tǒng)上因為省去內存管理組態(tài)的搬遷,所以一樣可以加速,很明顯的,線程使執(zhí)行的發(fā)派、分配更加細膩與靈活化。
線程的副作用
線程雖有好用的優(yōu)點,不過它也有副作用的缺點,且此一優(yōu)缺是一體兩面無從分割,缺點是各個線程共享同一組內存管理組態(tài)及機制,倘若有一個線程的執(zhí)行發(fā)生錯誤、瑕疵、或遭入侵等,其余在同一個行程內的每個線程也都會遭受影響、波及,最嚴重是同一個行程內的一切都錯亂、毀壞,由此可知:線程其實是帶有若干安全性犧牲的加速法。
此外有人會誤會,就字面上而言,多核表示同時間有多顆處理器在執(zhí)行,每顆處理器可以執(zhí)行一個行程或一個線程,但是一顆具有多線程能力的處理器并不表示它可以同時執(zhí)行多個線程,事實上在同一時間內一顆具多線程功效的處理器也依然是執(zhí)行一個線程而已,只是多線程處理器的內部可以將原有線程的相關信息及變量暫時擱擺,然后去執(zhí)行其它的線程,執(zhí)行完后在切換回原來執(zhí)行到一半的線程,甚至沒執(zhí)行完也可以切換回來,且整個切換過程都在處理器內進行,不用與快取與內存進行搬遷置換,如此以快速換線程執(zhí)行的方式來加速。
相對于此的,一顆不具多線程能力的處理器,執(zhí)行一個線程到一半若想改執(zhí)行另一個線程,就必須將原線程、現(xiàn)線程的相關內容與信息搬遷到快取或內存,然后自快取及內存引入另一個線程,由于此一搬轉頗耗時,所以多半選擇將原有的線程執(zhí)行完再引入下一個線程,如此在時間上可能還比較經濟。然而無論一線程完整執(zhí)行后再執(zhí)行下一個線程,還是進行線程的進出搬遷轉移,都不會比具備多線程能力的處理器來的快速有效。
至此我們可以歸納整理:
1.多核、多處理器系統(tǒng)中的每顆處理器(每個核),同時間內可以執(zhí)行各自不同的行程(或線程)。
2.一顆多線程能力的處理器,無論是支持二線程、四線程、八線程,這些線程都必須是在同一個行程內,所以一顆處理器(一個核)還是只能執(zhí)行一個行程,雙核處理器就能夠同時執(zhí)行兩個不同的行程(或線程),四核就可以同時不同的四個行程(或線程)。
3.倘若是執(zhí)行不支持多線程的程序,其執(zhí)行上的分拆最多只到行程而未到線程,那么每顆處理器內的多線程功效就無從發(fā)揮,而這類的程序歷史較長久,相對的原生支持多線程的程序歷史較短,不過信息技術的腳步向來進展快速,兩種不同層次的支持僅差距數年時間。
產業(yè)實際發(fā)展可為證明
真的是多核優(yōu)于、先于多線程嗎?關于此可通過產業(yè)實際發(fā)展做為應證,Sun的UltraSPARC T1處理器(研發(fā)代號:Niagara)是八核四線程的設計,但接續(xù)的UltraSPARC T2處理器(研發(fā)代號:Niagara 2)則是八核八線程的設計,所以是核多、核優(yōu)先,然后再來拉跋、提升線程的執(zhí)行。
同樣的,IBM為Microsoft Xbox 360所設計的Xenon處理器,是個三核二線程的設計,核數依然是高于線程數,又如 IBM、Sony、Toshiba三家業(yè)者合研的Cell處理器,現(xiàn)有第一代的Cell(研發(fā)代號:DD1)是九核,組態(tài)上是八核媒體(SPE)、一核泛用(PPE),新一代的Cell(研發(fā)代號:DD2)也針對PPE的部分進行雙線程發(fā)展,如此再次表示核比線程重要,當Cell僅進行增一線程的擴展改進時,而非再增一核,即可知這僅是一次小幅的改進。
“多核”、“多線程”之外 還有“多令”、“多機”
最后,且讓我們談談與多核、多線程不同加速走向的“多令”,“多令”是筆者發(fā)明的詞,指的是比執(zhí)行行程(Process)、線程(Thread)更基底層次的執(zhí)行指令(Instruction),多核的作法是盡可能在同時間內執(zhí)行多個行程,多令則是盡可能在同時間內執(zhí)行多個指令,學術上的VLIW與產業(yè)上的EPIC皆是多令理念下的架構。
到目前為止多令并非不可行,但僅行于數字信號、圖像等處理,繪圖芯片、媒體處理器等多實行VLIW架構,然多令在泛用運算上卻未見效益,至于科學研究之類的高效運算也傾向使用更高層次的平行:多機(叢集、網格,執(zhí)行范疇與分配類同于線程、行程),看來多令、多程/線程、多機各有所用,端看運用場合的適切性。
評論