面向瞬時(shí)故障的可配置容錯(cuò)技術(shù)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩158頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著處理器設(shè)計(jì)朝更小的晶體管特征尺寸、更低的工作電壓和更高的頻率發(fā)展,瞬時(shí)故障引發(fā)的可靠性問(wèn)題已經(jīng)引起整個(gè)計(jì)算市場(chǎng)的關(guān)注。由于不同領(lǐng)域的用戶(hù)對(duì)系統(tǒng)可靠性、成本、性能、功耗等指標(biāo)的要求不同,如何面向不同用戶(hù)的不同需求提供可靠性和代價(jià)滿(mǎn)足約束的可靠性解決方案,成為處理器設(shè)計(jì)者必須面對(duì)的挑戰(zhàn)。為了應(yīng)對(duì)這種挑戰(zhàn),本文重點(diǎn)研究了可配置、低代價(jià)的容錯(cuò)保護(hù)技術(shù)。此外,為了分析瞬時(shí)故障的影響和容錯(cuò)技術(shù)的可靠性,本文也研究了基于故障注入的可靠性分析技術(shù)。

2、本研究主要內(nèi)容包括:
 ?、盘幚砥鬟\(yùn)算單元中的故障可能導(dǎo)致程序運(yùn)行出現(xiàn)數(shù)據(jù)流錯(cuò)誤或控制流錯(cuò)誤。其中,數(shù)據(jù)流錯(cuò)誤檢測(cè)通常基于冗余計(jì)算的方法進(jìn)行,如何降低冗余計(jì)算的開(kāi)銷(xiāo)(性能、硬件開(kāi)銷(xiāo)等)是困擾容錯(cuò)研究至今的難點(diǎn)問(wèn)題。為了解決這一問(wèn)題,結(jié)合軟、硬件容錯(cuò)技術(shù)的優(yōu)勢(shì),提出了一種可配置的數(shù)據(jù)流檢測(cè)技術(shù)Epipe。Epipe首先通過(guò)改造現(xiàn)有的超標(biāo)量流水線(xiàn)處理器,提供了一個(gè)能夠?qū)χ噶钸M(jìn)行選擇性冗余保護(hù)的硬件平臺(tái)。由于超標(biāo)量處理器中有豐富的計(jì)算資

3、源,Epipe平臺(tái)只需要很少的硬件開(kāi)銷(xiāo)。為了減少冗余保護(hù)產(chǎn)生的性能開(kāi)銷(xiāo),Epipe還基于程序分析方法評(píng)估每個(gè)指令的重要性,即指令發(fā)生故障后導(dǎo)致程序輸出錯(cuò)誤結(jié)果的概率。程序運(yùn)行時(shí),Epipe根據(jù)用戶(hù)的性能和可靠性要求選擇保護(hù)最重要的一部分指令。Epipe的創(chuàng)新點(diǎn)在于,Epipe只冗余保護(hù)發(fā)生故障后導(dǎo)致程序輸出錯(cuò)誤結(jié)果的指令,對(duì)于導(dǎo)致系統(tǒng)異常或超時(shí)的故障則直接利用系統(tǒng)中的異常檢測(cè)機(jī)制加以處理,而剩余的不會(huì)影響程序執(zhí)行的故障(即被屏蔽的故障)

4、則不需要任何處理。這種分類(lèi)處理故障的方法有效地減少了需要冗余保護(hù)的指令,再結(jié)合時(shí)空開(kāi)銷(xiāo)較低的硬件指令保護(hù)技術(shù),使得Epipe技術(shù)可以更低的開(kāi)銷(xiāo)保護(hù)程序數(shù)據(jù)流。
 ?、茖?shí)現(xiàn)控制流檢測(cè)的一種有效技術(shù)是軟件實(shí)現(xiàn)的標(biāo)簽分析方法。已有的標(biāo)簽分析技術(shù)除了存在時(shí)空開(kāi)銷(xiāo)過(guò)大和可靠性不足的問(wèn)題外,還缺乏可配置性,無(wú)法滿(mǎn)足不同用戶(hù)的不同需求。此外,軟件檢測(cè)技術(shù)引入的冗余代碼自身也有可能發(fā)生錯(cuò)誤,現(xiàn)有的控制流檢測(cè)技術(shù)在容錯(cuò)機(jī)制的自我保護(hù)方面缺乏研究。為

5、了克服上述不足,本文提出了一種可配置的控制流檢測(cè)算法CFCES。CFCES通過(guò)為每個(gè)程序塊設(shè)計(jì)特殊格式的標(biāo)簽并在其中插裝額外的控制流檢測(cè)指令,以較少的開(kāi)銷(xiāo)有效地克服了已有算法的檢測(cè)盲點(diǎn)。而且,CFCES在設(shè)計(jì)檢測(cè)機(jī)制時(shí)引入了一種被稱(chēng)為“對(duì)等性”的不變量,通過(guò)對(duì)這種不變量進(jìn)行檢測(cè),CFCES能夠以極低的代價(jià)實(shí)現(xiàn)檢錯(cuò)機(jī)制的自容錯(cuò)保護(hù)。此外,CFCES還通過(guò)分析函數(shù)的重要性和調(diào)節(jié)程序塊的大小提供了可配置的優(yōu)化方法,可以滿(mǎn)足用戶(hù)不同的時(shí)空開(kāi)銷(xiāo)和

6、可靠性約束。CFCES優(yōu)化方法的特點(diǎn)在于其可以提高CFCES的容錯(cuò)效率,且可以用于優(yōu)化其它基于標(biāo)簽分析的控制流檢測(cè)算法。
  ⑶瞬時(shí)故障不僅可能發(fā)生在處理器運(yùn)算單元,也有可能出現(xiàn)在處理器存儲(chǔ)單元中。被廣泛用于保護(hù)片外存儲(chǔ)的ECC技術(shù)并不適合用來(lái)保護(hù)片上存儲(chǔ)結(jié)構(gòu),原因是這些存儲(chǔ)結(jié)構(gòu)本身已經(jīng)占用了大部分芯片面積,并且訪(fǎng)問(wèn)頻繁,采用ECC保護(hù)會(huì)帶來(lái)大量的面積、性能和功耗開(kāi)銷(xiāo)。鑒于現(xiàn)有的容錯(cuò)研究中十分缺乏針對(duì)片上存儲(chǔ)結(jié)構(gòu)的合理保護(hù)方案,本

7、文針對(duì)一種特殊的片上存儲(chǔ)結(jié)構(gòu)SPM提出了低代價(jià)的保護(hù)技術(shù)PPS。盡管用ECC對(duì)SPM進(jìn)行完全保護(hù)的開(kāi)銷(xiāo)很高,但是對(duì)部分SPM存儲(chǔ)進(jìn)行ECC保護(hù)并進(jìn)行合理分配仍是非常有價(jià)值的。PPS技術(shù)首先設(shè)計(jì)了基于部分ECC保護(hù)SPM的存儲(chǔ)體系結(jié)構(gòu)(被保護(hù)的比例可以根據(jù)不同應(yīng)用的可靠性、性能等需求決定),然后對(duì)程序中的待分配變量進(jìn)行脆弱性分析,并將SPM空間劃分為“寄存器”,最后采取基于優(yōu)先級(jí)的圖著色方法將較為脆弱的變量?jī)?yōu)先分配到ECC保護(hù)的“寄存器”

8、中?;谏鲜龇椒?,PPS能夠以較低的開(kāi)銷(xiāo)獲得較高的存儲(chǔ)可靠性。
 ?、裙收献⑷胧且环N有效且廣為應(yīng)用的可靠性分析方法。故障注入技術(shù)面臨的困難是如何平衡故障模擬速度與精度的關(guān)系。由于已有的故障注入技術(shù)還不能有效地解決上述問(wèn)題,本文提出了一種新的故障注入框架SmartInjector。SmartInjector首先基于程序分析從故障空間中刪除等價(jià)類(lèi)故障和結(jié)果確定型故障。等價(jià)類(lèi)故障是指發(fā)生在相似的數(shù)據(jù)流或控制流上下文環(huán)境中的故障。這類(lèi)故障

9、往往會(huì)導(dǎo)致系統(tǒng)產(chǎn)生相同的反應(yīng),因此只需要將它們劃為等價(jià)類(lèi)并從中選取代表進(jìn)行模擬注入即可,等價(jià)類(lèi)中其它故障則可以從故障空間中刪除。結(jié)果確定型故障是指那些通過(guò)程序分析就可以確定系統(tǒng)反應(yīng)的故障。SmartInjector還首次開(kāi)發(fā)了一種故障結(jié)果預(yù)測(cè)技術(shù),通過(guò)預(yù)測(cè)故障產(chǎn)生的結(jié)果和判定結(jié)果的位置,可以在程序運(yùn)行結(jié)束前提前判斷故障注入的結(jié)果,從而減少單次模擬的時(shí)間開(kāi)銷(xiāo)。結(jié)合提出的故障刪除技術(shù)和故障結(jié)果預(yù)測(cè)技術(shù),SmartInjector以少量的精度

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論