版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、語音識別技術(shù),主要是通過計(jì)算機(jī)語音處理技術(shù),實(shí)現(xiàn)一種人機(jī)界面,為人與人和人與計(jì)算機(jī)之間的順暢交流提供一種便捷的方式。自語音識別技術(shù)發(fā)展以來,已經(jīng)取得了一定的研究成果,國內(nèi)外諸多大公司也加大了對大詞匯量中文語音識別技術(shù)的開發(fā)和研究。在語音識別技術(shù)中,解碼器是最為關(guān)鍵的部分。
近年來,有限狀態(tài)轉(zhuǎn)換器被廣泛應(yīng)用于語音識別技術(shù)中。由于有限狀態(tài)轉(zhuǎn)換器不僅可以使用于模擬訊號模型,更可以進(jìn)一步模擬自然語言中許多重要且繁復(fù)的文法結(jié)構(gòu)與文法特性
2、。因此,有限狀態(tài)轉(zhuǎn)換器成為語音研究有力的工具。
本文主要討論帶權(quán)有限狀態(tài)轉(zhuǎn)換器在大詞匯量中文語音識別系統(tǒng)中的應(yīng)用。它的基本思想是,將聲學(xué)模型、發(fā)音詞典、語言模型分別用一個(gè)加權(quán)有限狀態(tài)轉(zhuǎn)換器來表示。然后通過組合演算法將其整合為一個(gè)完整的加權(quán)有限狀態(tài)轉(zhuǎn)換器模型,從而可以得到一個(gè)同一維度的語音識別搜索空間。
本論文可分為四個(gè)部分:第一個(gè)部分是帶權(quán)有限狀態(tài)機(jī)相關(guān)的基本概念和理論推導(dǎo);第二部分討論如何將傳統(tǒng)語音識別中所使用的聲
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于g.723.1語音解碼器的asic設(shè)計(jì)
- 基于CELP的低速率語音編解碼器.pdf
- 基于g.729語音解碼器的asic設(shè)計(jì)
- 基于μClinux的語音編解碼器的實(shí)現(xiàn)和優(yōu)化.pdf
- rh-618解碼器(中文)
- 基于FPGA的LD-CELP語音編解碼器設(shè)計(jì).pdf
- 基于melp2.4kbps語音編解碼器的改進(jìn)
- 基于DSP的通用語音編解碼器的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于FPGA的AAC解碼器實(shí)現(xiàn).pdf
- 基于MNB2算法的語音編解碼器客觀評估平臺研究.pdf
- 移動IP語音通信系統(tǒng)音頻編解碼器的研究.pdf
- 基于SoPC技術(shù)的通用解碼器.pdf
- 基于vpm642的g.729a語音編解碼器的實(shí)現(xiàn)
- 基于TMS320C6713的變速率語音編解碼器的實(shí)現(xiàn)研究.pdf
- 基于FPGA的低功耗JPEG解碼器的研究.pdf
- 基于pnx1500的g.723.1語音編解碼器的研究與實(shí)現(xiàn)
- 基于tms320vc5402的g.729語音編解碼器研究
- 基于Apollo芯片的WMV解碼器開發(fā).pdf
- 基于MPEG-2的軟件解碼器.pdf
- 基于MIPS的AAC實(shí)時(shí)多路解碼器.pdf
評論
0/150
提交評論