基于視覺顯著性的平躺人體檢測方法研究.pdf_第1頁
已閱讀1頁,還剩125頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、顯著性目標(biāo)檢測是計算機(jī)視覺與模式識別領(lǐng)域的基本問題和關(guān)鍵環(huán)節(jié),直接影響到顯著性檢測、目標(biāo)檢測、行為檢測、目標(biāo)跟蹤、行為識別等多項研究,是多學(xué)科間聯(lián)系的重要紐帶,關(guān)乎計算機(jī)視覺、神經(jīng)認(rèn)知學(xué)和視覺心理學(xué)等交叉領(lǐng)域的發(fā)展。受神經(jīng)生理學(xué)的稀疏編碼和反饋機(jī)理啟發(fā),利用全局特征和局部特征視覺顯著性機(jī)理,確定平躺人體在圖像中的大致位置,再利用透射變換、姿態(tài)建模、特征旋轉(zhuǎn)不變性和深度學(xué)習(xí)等檢測出平躺人體的準(zhǔn)確位置。對高分辨率探測技術(shù)的低空俯視圖像進(jìn)行顯

2、著性平躺人體檢測,在理論和實踐中都極具重要意義。
  自然災(zāi)害環(huán)境下低空俯視圖像的平躺人體檢測主要存在姿態(tài)多樣性、任意朝向、任意視角、嚴(yán)重透視形變和平面內(nèi)旋轉(zhuǎn)等問題,較行人檢測更具復(fù)雜性和挑戰(zhàn)性,是計算機(jī)視覺和模式識別應(yīng)用如視頻監(jiān)控、災(zāi)害救助、生物特征識別、醫(yī)療護(hù)理和公共服務(wù)機(jī)器人等的關(guān)鍵問題。本文重點圍繞如何構(gòu)建一個快速、準(zhǔn)確的視覺顯著性平躺人體檢測新框架,確??蚣苡欣谙蚱渌囟繕?biāo)檢測或者通用目標(biāo)檢測的遷移,論文的主要研究內(nèi)

3、容和創(chuàng)新點如下:
  1.構(gòu)建了廈門大學(xué)平躺人體數(shù)據(jù)集(XMULP)和平躺人體姿態(tài)模型。平躺人體檢測研究處于起步階段,可參考的資料以及數(shù)據(jù)集非常少,低空俯視下自然災(zāi)害環(huán)境的平躺人體數(shù)據(jù)集構(gòu)建更為困難。為此,本文作者實驗室研究小組構(gòu)建了性能優(yōu)良的低空俯視圖像平躺人體數(shù)據(jù)庫(XMULP),數(shù)據(jù)集充分包含了平躺人體的多姿態(tài)、任意視角、任意朝向和復(fù)雜背景等客觀因素,豐富了平躺人體數(shù)據(jù)集,為推動平躺人體檢測的研究啟到了催化劑效果。根據(jù)平躺人

4、體樣本固有的特性,提出了平躺人體姿態(tài)建模,解決平躺人體姿態(tài)多樣性、任意視角、嚴(yán)重透視形變和平面內(nèi)旋轉(zhuǎn)等問題。
  2.提出了基于樣本擴(kuò)充和特定姿態(tài)的平躺人體檢測策略,構(gòu)建多模型平躺人體檢測器,有效地提升了檢測器的性能。為了進(jìn)一步豐富平躺人體數(shù)據(jù)集,提出了樣本自動擴(kuò)充策略,解決樣本收集難和樣本少的問題。擴(kuò)充策略有兩種,一種是基于透視變換擴(kuò)充策略,實現(xiàn)樣本在幾何空間中的擴(kuò)充;另一種是基于Mean-Shift算法、Gibbs算法擴(kuò)充策略

5、,實現(xiàn)樣本在特征空間中的擴(kuò)充。擴(kuò)充后的樣本數(shù)據(jù)分布更接近自然場景下平躺人體的實際情況,更具有多姿態(tài)、任意視角和平面內(nèi)旋轉(zhuǎn)等特性。綜合分析平躺人體的固有的特性,提出了基于特定姿態(tài)的平躺人體檢測,對擴(kuò)充后的數(shù)據(jù)集進(jìn)行姿態(tài)建模,構(gòu)建多模型平躺人體檢測器,實驗驗證了模型的檢測性能。
  3.受顯著性目標(biāo)區(qū)域的啟發(fā),提出了基于旋轉(zhuǎn)不變描述子和旋轉(zhuǎn)角度重現(xiàn)的平躺人體檢測算法,避免目標(biāo)搜索在旋轉(zhuǎn)空間中的嚴(yán)重耗時等問題,克服了噪聲干擾,極大地降低

6、了目標(biāo)搜索的時間復(fù)雜度。通過快速傅里葉分析,構(gòu)建有效的Fourier HOG旋轉(zhuǎn)不變描述子,將目標(biāo)搜索從旋轉(zhuǎn)-尺度空間(rotation-scale space)降低到尺度空間(scale space)。并利用主成分分析(PCA)恢復(fù)出顯著圖區(qū)域的主方向,快速估計出平躺人體的具體位置。研究檢測器在一定灰度級的非線性變換、尺度變換、姿態(tài)、遮擋情況下的魯棒性能,在XMULP數(shù)據(jù)集中獲得平均準(zhǔn)確率(AP)為50.3%較好性能。
  4.

7、受生物特征識別機(jī)理的啟發(fā),提出了基于Objectness對象快速估計的平躺人體富特征學(xué)習(xí),進(jìn)一步提高了檢測器的準(zhǔn)確率,加快了檢測器的檢測速度。以視覺顯著性的視覺心理學(xué)動機(jī)為切入點,重點研究圖像局部特征在特征空間和物理空間中的組織關(guān)系,引入全局視覺顯著性檢測和BING特征,快速估計圖像中的Objectness對象,從不同空間構(gòu)造局部視覺特征,利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)構(gòu)建Objectness對象深度學(xué)習(xí)模型,并評測它們的檢測性能和計算復(fù)雜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論