大屏幕人機互動中若干關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩141頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、大屏幕多媒體的展示系統(tǒng)越來越多地應用在各種場合,例如科技館、展覽館等場所,而日前大屏幕人機交互還沒有完善的解決方案。手勢交互具有交互自然、體驗性好等優(yōu)勢,更符合人類交互的的需求,已經成為大屏幕人機交互方案的研究熱點。
   大屏幕人機交互主要涉及三個方面的內容,人機交互時交互人體的跟蹤,交互手勢的跟蹤與識別,以及交互時涉及到的文字輸入問題。本文論文主要貢獻如下:
   在物體檢測方面提出了一種高斯背景模型快速更新背景機制

2、,利用即時背景差分和高斯混合模型相結合的方法,解決在光線瞬間變化等情況下,高斯背景由于更新背景速度慢,導致前景誤檢測問題。
   在人體跟蹤方面探討了基于Meanshift的跟蹤算法,針對Meanshift的單一顏色特征和整體目標區(qū)域建立模型,在目標尺度變化、光線變化情況下魯棒性差的問題,提出基于分模塊和對每個模塊采用紋理和顏色特征建立模型,大大提高了算法的魯棒性。并探討了人體遮擋情況下的人體跟蹤算法,結合卡爾曼濾波預測算法,在

3、人體完全遮擋的情況下取得了良好的跟蹤效果。
   提出了一種簡單的雙目視覺定位方法,利用攝像頭的投影幾何原理和空間直線的關系,避免了傳統(tǒng)雙目視覺定位的復雜的攝像頭標定流程,不利于實際場合使用。在精度不變的情況下,提高了實用性。
   提出了一種通過識別靜態(tài)手勢,向拼音輸入法輸入拼音,以達到利用手勢向系統(tǒng)輸入漢字功能。利用深度圖像分割出靜態(tài)手勢,避免了傳統(tǒng)RGB攝像頭采集手勢時,受慣性、背景復雜性以及光照等影響,提高了魯棒

4、性。在提取靜態(tài)手勢特征上,采用SIFT特征提取方法,既保留了輪廓的各種旋轉,縮放不變形,又加強了局部區(qū)域特征,提高識別率。手勢分類則采用了SVM方法,構造一個多分類樹結合漢字拼音的規(guī)則,能提供一分鐘十個漢字左右的輸入方法,可以有效地滿足搜索等需要關鍵字的文字輸入需求。
   在動態(tài)手勢交互方面,動態(tài)手勢跟蹤利用粒子濾波能夠處理非線性目標以及非高斯分布系統(tǒng)的特性,使用粒子濾波算法對手勢進行跟蹤,獲取手勢軌跡。傳統(tǒng)的粒子濾波在樣本重

5、采樣過程中,會造成樣本的“貧化”問題,本文利用樣本周圍像素產生樣本,利用Hausdorff距離計算個各樣本的權值,利用隨機平均分布獲得隨機數,通過周圍像素產生的樣本獲得偽隨機樣本,解決重采樣造成的樣本“貧化”問題。得到手勢的軌跡,利用16方向角進行離散量化,作為手勢識別的輸入向量。由于隱式馬爾科夫鏈(HMM)可以同時對空間和時間相關關系建立模型,適用于動態(tài)手勢識別。傳統(tǒng)的HMM初始狀態(tài)個數是根據經驗值,而本文提出一種利用關鍵點算法對不同

6、的手勢初始狀態(tài)設定不同的值,使得初始狀態(tài)設定有個參考機制。在選擇訓練樣本時,利用混沌算法,找出訓練樣本的最優(yōu)值,使得訓練出的HMM模型具有全局最優(yōu)特性。利用一種閾值的方法,對傳統(tǒng)HMM方法進行改進,使得HMM具有一定的拒識率,最大可能地排除輸入的錯誤手勢,提高識別率,實驗驗證了方法的有效性,可以進行人機交互。
   通過實驗可以驗證,本文有效地解決了的大屏幕多媒體交互中出現的三個問題,可以使用戶在大屏幕入機交互中有較好的,更自然

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論