多核平臺上支持推測并行化的事務(wù)存儲體系結(jié)構(gòu)性能優(yōu)化.pdf_第1頁
已閱讀1頁,還剩145頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著多核平臺的普及,如何利用多核加速串行應(yīng)用的執(zhí)行已成為學(xué)術(shù)界和工業(yè)界共同關(guān)注的熱點(diǎn)研究問題。而傳統(tǒng)的顯式鎖同步機(jī)制自身就有著高復(fù)雜性、易錯性和性能保守等天然缺陷,從根本上限制了并行程序的可擴(kuò)展性和編程效率,也限制了對多核資源的充分利用。為了開發(fā)更多的多核結(jié)構(gòu)上可利用的線程級并行性,利用事務(wù)存儲(Transactional Memory,TM)技術(shù)來解決并行程序正確性維護(hù)給并行編程帶來的復(fù)雜性和對性能的制約問題,已成為學(xué)術(shù)界和工業(yè)界的共

2、識。本文從有效開發(fā)應(yīng)用中的線程級并行性入手,著眼于高效能、易編程和可兼容這三個目標(biāo),通過軟硬件協(xié)同的優(yōu)化方式對支持推測并行化的多核事務(wù)存儲體系結(jié)構(gòu)展開深入研究,使之既能提高多核芯片片上計(jì)算資源的有效利用率,又能有效降低并行編程難度,平滑移植傳統(tǒng)應(yīng)用軟件。
   本文從線程劃分和線程執(zhí)行兩個方面,對軟硬件協(xié)同支持推測并行化的多核事務(wù)存儲體系結(jié)構(gòu)性能優(yōu)化開展了深入系統(tǒng)的研究,涉及結(jié)構(gòu)模型、編程模型、性能分析模型、離線剖析指導(dǎo)線程劃分

3、機(jī)制和在線剖析指導(dǎo)線程執(zhí)行機(jī)制等方面的內(nèi)容。主要研究內(nèi)容和成果包括:(1)對兩樸主流線程級推測并行技術(shù)的發(fā)展趨勢進(jìn)行了詳細(xì)而深入的調(diào)研,通過對其軟硬件支持機(jī)制的分析與比較,提出了一種新型的軟硬件協(xié)同支持推測并行化的多核事務(wù)存儲體系結(jié)構(gòu)設(shè)計(jì)方案。該系統(tǒng)在線程劃分中采用軟件線程級推測技術(shù)思想,而在線程執(zhí)行時采用硬件事務(wù)存儲技術(shù)支持,并通過離線剖析和在線剖析技術(shù)來協(xié)同各種軟硬件因素,達(dá)到了同時提高程序性能和降低并行編程難度的雙重目標(biāo)。(2)在

4、軟件線程劃分方面,從簡化并行編程和提高并行執(zhí)行性能的優(yōu)化角度出發(fā),提出了一套線程級推測并行性的判定準(zhǔn)則、研究方法和剖析機(jī)制,確定了利用離線剖析技術(shù)來實(shí)現(xiàn)基于事務(wù)存儲的線程劃分方案。并依據(jù)該機(jī)制設(shè)計(jì)并實(shí)現(xiàn)了一套線程級推測并行性離線剖析工具集OpenPro。(3)利用OpenPro工具集,對桌面應(yīng)用、多媒體應(yīng)用和高性能計(jì)算應(yīng)用中影響線程級推測并行性的關(guān)鍵因素進(jìn)行剖析,從應(yīng)用本身并行潛能的角度進(jìn)行探討,獲得了諸如單個程序僅能有效利用16核的計(jì)

5、算資源是當(dāng)前多核技術(shù)路線的拐點(diǎn)等一些重要認(rèn)識。(4)在線程執(zhí)行支持機(jī)制方面,從可擴(kuò)展性好和易于硬件實(shí)現(xiàn)這兩個優(yōu)化目標(biāo)出發(fā),提出了一種支持優(yōu)先級判定的基于目錄的高速緩存一致性協(xié)議,并在此基礎(chǔ)上設(shè)計(jì)和完成了一種利用運(yùn)行時庫機(jī)制同時支持線程級推測和事務(wù)存儲語義的分布式可擴(kuò)展多核事務(wù)存儲處理器PTT硬件模擬器。該處理器設(shè)計(jì)突破了以往類似方案中總線等集中式結(jié)構(gòu)對硬件系統(tǒng)可擴(kuò)展性的限制,同時實(shí)現(xiàn)了可擴(kuò)展性好和易于硬件設(shè)計(jì)實(shí)現(xiàn)的目標(biāo);而這套采用積極版

6、本管理和積極檢測機(jī)制的分布式硬件事務(wù)存儲機(jī)制會自動維護(hù)硬件系統(tǒng)的一致性,極大地減少了程序員在進(jìn)行并行程序設(shè)計(jì)時的繁雜工作和復(fù)雜程度。這對于普及并行程序設(shè)計(jì),提高并行程序生產(chǎn)力都有著非常重要的意義。(5)提出了一種針對線程級推測并行技術(shù)的PCL性能分析模型,并依據(jù)該模型提出了將在線剖析技術(shù)引入PTT硬件模擬平臺的最終優(yōu)化方案。同時通過對PTT系統(tǒng)多種軟硬件手段實(shí)現(xiàn)機(jī)制的分析與協(xié)同,分別從正確性、有效性和靈活可配置性三個層次對其進(jìn)行了充分的

7、評測和分析。
   本文的研究工作獲得了如下一些重要的認(rèn)識:(1)將線程級推測技術(shù)與事務(wù)存儲技術(shù)結(jié)合起來,通過軟硬件因素的合理協(xié)調(diào),可以有效地開發(fā)出串行程序中潛在的線程級并行性,同時有效地降低并行編程的難度,極大地提高并行程序設(shè)計(jì)生產(chǎn)力。(2)在目前以傳統(tǒng)超標(biāo)量單核構(gòu)造多核芯片的技術(shù)路線下,著眼于同時兼顧硬件的有效利用率和盡可能挖掘程序中固有的并行性,在加速單個串行應(yīng)用時,部分依賴嚴(yán)重的應(yīng)用(如SPEC和一些依賴嚴(yán)重的科學(xué)計(jì)算程

8、序等)采用2-4核就已經(jīng)足夠;而多數(shù)多媒體應(yīng)用和高性能計(jì)算應(yīng)用采用8-16核來加速比較合適;一些特別適合的應(yīng)用則可以有效利用64-128核及以上的計(jì)算資源。(3)雖然現(xiàn)在線程級推測并行技術(shù)在桌面應(yīng)用這樣一些程序中數(shù)據(jù)依賴嚴(yán)重的應(yīng)用中效果不佳,但在部分擁有大計(jì)算量、推測線程粒度適中并且存在模糊依賴的多媒體和高性能計(jì)算應(yīng)用中還是適宜采用的。線程級推測并行技術(shù)最大的優(yōu)勢是其兼容性與易編程性,只要在這兩點(diǎn)上做好文章,實(shí)現(xiàn)多數(shù)經(jīng)典應(yīng)用軟件到多核平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論