版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、隨著處理器設(shè)計朝更小的晶體管特征尺寸、更低的工作電壓和更高的頻率發(fā)展,瞬時故障引發(fā)的可靠性問題已經(jīng)引起整個計算市場的關(guān)注。由于不同領(lǐng)域的用戶對系統(tǒng)可靠性、成本、性能、功耗等指標的要求不同,如何面向不同用戶的不同需求提供可靠性和代價滿足約束的可靠性解決方案,成為處理器設(shè)計者必須面對的挑戰(zhàn)。為了應(yīng)對這種挑戰(zhàn),本文重點研究了可配置、低代價的容錯保護技術(shù)。此外,為了分析瞬時故障的影響和容錯技術(shù)的可靠性,本文也研究了基于故障注入的可靠性分析技術(shù)。
2、本研究主要內(nèi)容包括:
?、盘幚砥鬟\算單元中的故障可能導(dǎo)致程序運行出現(xiàn)數(shù)據(jù)流錯誤或控制流錯誤。其中,數(shù)據(jù)流錯誤檢測通?;谌哂嘤嬎愕姆椒ㄟM行,如何降低冗余計算的開銷(性能、硬件開銷等)是困擾容錯研究至今的難點問題。為了解決這一問題,結(jié)合軟、硬件容錯技術(shù)的優(yōu)勢,提出了一種可配置的數(shù)據(jù)流檢測技術(shù)Epipe。Epipe首先通過改造現(xiàn)有的超標量流水線處理器,提供了一個能夠?qū)χ噶钸M行選擇性冗余保護的硬件平臺。由于超標量處理器中有豐富的計算資
3、源,Epipe平臺只需要很少的硬件開銷。為了減少冗余保護產(chǎn)生的性能開銷,Epipe還基于程序分析方法評估每個指令的重要性,即指令發(fā)生故障后導(dǎo)致程序輸出錯誤結(jié)果的概率。程序運行時,Epipe根據(jù)用戶的性能和可靠性要求選擇保護最重要的一部分指令。Epipe的創(chuàng)新點在于,Epipe只冗余保護發(fā)生故障后導(dǎo)致程序輸出錯誤結(jié)果的指令,對于導(dǎo)致系統(tǒng)異常或超時的故障則直接利用系統(tǒng)中的異常檢測機制加以處理,而剩余的不會影響程序執(zhí)行的故障(即被屏蔽的故障)
4、則不需要任何處理。這種分類處理故障的方法有效地減少了需要冗余保護的指令,再結(jié)合時空開銷較低的硬件指令保護技術(shù),使得Epipe技術(shù)可以更低的開銷保護程序數(shù)據(jù)流。
⑵實現(xiàn)控制流檢測的一種有效技術(shù)是軟件實現(xiàn)的標簽分析方法。已有的標簽分析技術(shù)除了存在時空開銷過大和可靠性不足的問題外,還缺乏可配置性,無法滿足不同用戶的不同需求。此外,軟件檢測技術(shù)引入的冗余代碼自身也有可能發(fā)生錯誤,現(xiàn)有的控制流檢測技術(shù)在容錯機制的自我保護方面缺乏研究。為
5、了克服上述不足,本文提出了一種可配置的控制流檢測算法CFCES。CFCES通過為每個程序塊設(shè)計特殊格式的標簽并在其中插裝額外的控制流檢測指令,以較少的開銷有效地克服了已有算法的檢測盲點。而且,CFCES在設(shè)計檢測機制時引入了一種被稱為“對等性”的不變量,通過對這種不變量進行檢測,CFCES能夠以極低的代價實現(xiàn)檢錯機制的自容錯保護。此外,CFCES還通過分析函數(shù)的重要性和調(diào)節(jié)程序塊的大小提供了可配置的優(yōu)化方法,可以滿足用戶不同的時空開銷和
6、可靠性約束。CFCES優(yōu)化方法的特點在于其可以提高CFCES的容錯效率,且可以用于優(yōu)化其它基于標簽分析的控制流檢測算法。
?、撬矔r故障不僅可能發(fā)生在處理器運算單元,也有可能出現(xiàn)在處理器存儲單元中。被廣泛用于保護片外存儲的ECC技術(shù)并不適合用來保護片上存儲結(jié)構(gòu),原因是這些存儲結(jié)構(gòu)本身已經(jīng)占用了大部分芯片面積,并且訪問頻繁,采用ECC保護會帶來大量的面積、性能和功耗開銷。鑒于現(xiàn)有的容錯研究中十分缺乏針對片上存儲結(jié)構(gòu)的合理保護方案,本
7、文針對一種特殊的片上存儲結(jié)構(gòu)SPM提出了低代價的保護技術(shù)PPS。盡管用ECC對SPM進行完全保護的開銷很高,但是對部分SPM存儲進行ECC保護并進行合理分配仍是非常有價值的。PPS技術(shù)首先設(shè)計了基于部分ECC保護SPM的存儲體系結(jié)構(gòu)(被保護的比例可以根據(jù)不同應(yīng)用的可靠性、性能等需求決定),然后對程序中的待分配變量進行脆弱性分析,并將SPM空間劃分為“寄存器”,最后采取基于優(yōu)先級的圖著色方法將較為脆弱的變量優(yōu)先分配到ECC保護的“寄存器”
8、中。基于上述方法,PPS能夠以較低的開銷獲得較高的存儲可靠性。
?、裙收献⑷胧且环N有效且廣為應(yīng)用的可靠性分析方法。故障注入技術(shù)面臨的困難是如何平衡故障模擬速度與精度的關(guān)系。由于已有的故障注入技術(shù)還不能有效地解決上述問題,本文提出了一種新的故障注入框架SmartInjector。SmartInjector首先基于程序分析從故障空間中刪除等價類故障和結(jié)果確定型故障。等價類故障是指發(fā)生在相似的數(shù)據(jù)流或控制流上下文環(huán)境中的故障。這類故障
9、往往會導(dǎo)致系統(tǒng)產(chǎn)生相同的反應(yīng),因此只需要將它們劃為等價類并從中選取代表進行模擬注入即可,等價類中其它故障則可以從故障空間中刪除。結(jié)果確定型故障是指那些通過程序分析就可以確定系統(tǒng)反應(yīng)的故障。SmartInjector還首次開發(fā)了一種故障結(jié)果預(yù)測技術(shù),通過預(yù)測故障產(chǎn)生的結(jié)果和判定結(jié)果的位置,可以在程序運行結(jié)束前提前判斷故障注入的結(jié)果,從而減少單次模擬的時間開銷。結(jié)合提出的故障刪除技術(shù)和故障結(jié)果預(yù)測技術(shù),SmartInjector以少量的精度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向瞬時故障的片上網(wǎng)絡(luò)容錯機制研究.pdf
- 面向柔性可配置服務(wù)的云制造任務(wù)管理技術(shù)研究.pdf
- 星載擺臂控制系統(tǒng)瞬時故障軟件容錯技術(shù)研究.pdf
- mba論文面向柔性可配置服務(wù)的云制造任務(wù)管理技術(shù)研究pdf
- 面向COTS DSP的可配置容錯自動轉(zhuǎn)換工具的研究與實現(xiàn).pdf
- 面向云計算的性能與功耗可配置安全終端技術(shù)研究.pdf
- 基于CISC可配置多發(fā)射技術(shù)研究.pdf
- 面向服務(wù)的動態(tài)可配置數(shù)控系統(tǒng)及其關(guān)鍵技術(shù)研究.pdf
- 面向混聯(lián)機床的故障檢測方法與精度容錯技術(shù)研究.pdf
- WiMAX系統(tǒng)可配置MIMO檢測技術(shù)研究.pdf
- 基于可配置BOM的游艇集成建造系統(tǒng)技術(shù)研究.pdf
- 可配置多模式GNSS信號同步技術(shù)研究.pdf
- 無線信道可配置Turbo譯碼組件技術(shù)研究.pdf
- 基于CISC可配置多通路譯碼技術(shù)研究.pdf
- 面向恢復(fù)的容錯計算技術(shù)研究.pdf
- 面向切面的軟件容錯技術(shù)研究.pdf
- 面向OpenFOAM的消息日志容錯技術(shù)研究.pdf
- 面向LonWorks技術(shù)的智能建筑可配置移動監(jiān)控平臺研究.pdf
- 面向切面的軟件容錯技術(shù)研究
- 面向環(huán)保物聯(lián)網(wǎng)的可配置軟件平臺.pdf
評論
0/150
提交評論