自主心智發(fā)育機器人的語音感知映射.pdf_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、說和聽是人類最為重要的信息獲取和傳達的手段。與文字等信息交流方式相比,基于語音的交互是絕大多數(shù)人所掌握的最普及、最自然的交互方式,不受使用者的教育水平和專業(yè)分類的約束。而隨著智能機器人的發(fā)展和高性能計算機的普及,若能夠以語音作為計算機或者智能機器人與使用者交互界面,將會極大的提升計算機和機器人的易用性、友好性,為人們在信息時代的生活帶來巨大的便利。自主心智發(fā)育作為一個新興的理論框架,有潛力解決傳統(tǒng)方法難以解決的復(fù)雜問題和跨任務(wù)問題。因此

2、,將自主心智發(fā)育理論框架和已有的高性能方法結(jié)合起來,使智能機器人能夠具備更強的語音交互能力,是一個值得深入探索的理論方向。傳統(tǒng)語音處理方法中需要針對特定領(lǐng)域、語言進行人工分析和設(shè)計以及人工干預(yù)訓(xùn)練,從而導(dǎo)致這些方法對環(huán)境的適應(yīng)能力以及對新語言新領(lǐng)域的擴展能力較弱,不能達到智能機器人在自然環(huán)境中為人類服務(wù)的設(shè)計要求。本文針對這個問題,以自主心智發(fā)育理論框架的任務(wù)無關(guān)的思想為前提,引入遞增計算、在線計算、在位計算等原理,通過對語音處理研究中

3、的經(jīng)典的隱馬爾可夫方法進行改進和擴展,將其融入到自主心智發(fā)育理論框架中,提出了雙隱層馬爾可夫模型,作為聽覺感知映射模塊的核心模型,為自主心智發(fā)育機器人這種新框架下的智能機器人進行針對性設(shè)計,使其具有在與外部的環(huán)境交互的過程中,自動產(chǎn)生和調(diào)整聲學(xué)單位內(nèi)部表達模型能力,讓智能機器人具有聽懂不同語種語言,自動適應(yīng)不同背景噪聲條件的潛力,并為機器人的聽說聯(lián)合打下基礎(chǔ)。隱馬爾可夫模型作為一種經(jīng)典的語音表達模型,在語音識別和語音合成等應(yīng)用中都取得了

4、一定的成果。但是這些成果都是針對特定領(lǐng)域的具體問題進行的,比如特定語言的語音識別,在識別之前必須要針對該語言和應(yīng)用領(lǐng)域訓(xùn)練大量的聲學(xué)模型和語言模型,這就導(dǎo)致了當(dāng)應(yīng)用場景和使用環(huán)境發(fā)生改變時,原有模型不適用,導(dǎo)致識別效果急劇下降的問題。本文通過對其進行雙隱層擴展,并調(diào)整其搜索和訓(xùn)練算法,使其能夠達到自主心智發(fā)育框架中感知映射的基本要求,無需人為干預(yù),不受環(huán)境限定,不針對特定語言和領(lǐng)域,使其能夠達到自主心智發(fā)育機器人的聽覺系統(tǒng)感知映射層次的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論