版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、語(yǔ)音識(shí)別技術(shù)在醫(yī)療信息化行業(yè)中的應(yīng)用日益凸顯。在電子病歷EMR系統(tǒng)中,語(yǔ)音識(shí)別技術(shù)的應(yīng)用可以有效提高病歷文本的輸入速度,省去醫(yī)生手動(dòng)輸入病歷的繁瑣過(guò)程。目前,基于語(yǔ)音識(shí)別的EMR系統(tǒng)主要存在兩大問(wèn)題:一是自然口語(yǔ)中的猶豫停頓FP、重復(fù)、修改等不流利現(xiàn)象給識(shí)別帶來(lái)了困難;二是識(shí)別出的病歷文本缺少必要的文本格式,致使其可讀性、易讀性不高。
為此,本文設(shè)計(jì)實(shí)現(xiàn)了醫(yī)學(xué)環(huán)境下的自然口語(yǔ)語(yǔ)音識(shí)別系統(tǒng);分析了病歷文本的結(jié)構(gòu)內(nèi)容和關(guān)鍵詞詞性分
2、布,在此基礎(chǔ)上改進(jìn)了詞頻-反向文檔頻率TF-IDF關(guān)鍵詞提取算法,提高了識(shí)別結(jié)果的可讀性、易讀性;設(shè)計(jì)實(shí)現(xiàn)了基于自然口語(yǔ)語(yǔ)音識(shí)別和關(guān)鍵詞自動(dòng)提取的EMR系統(tǒng)。本文的創(chuàng)新之處在于,通過(guò)建立FP檢測(cè)模型和面向醫(yī)學(xué)的語(yǔ)音識(shí)別系統(tǒng),提高了醫(yī)學(xué)環(huán)境下的自然口語(yǔ)語(yǔ)音識(shí)別效果;完成了對(duì)TF-IDF關(guān)鍵詞提取算法的改進(jìn),從病歷文本關(guān)鍵詞詞位置、關(guān)鍵詞詞性分布、病歷文本分類(lèi)入手,對(duì)關(guān)鍵詞提取中特征項(xiàng)權(quán)重進(jìn)行修正,使提取的關(guān)鍵詞能更好地反映病歷文本主題和關(guān)
3、鍵內(nèi)容。
本文的主要研究工作包括:
(1)完成了基于高斯混合模型-多層感知器GMM-MLP的FP檢測(cè)模型建模及訓(xùn)練,實(shí)現(xiàn)了自然口語(yǔ)語(yǔ)音中FP檢測(cè)功能,模型查全率Recall達(dá)到60%,查準(zhǔn)率Precision達(dá)到65%以上。
(2)構(gòu)建了醫(yī)學(xué)環(huán)境下的語(yǔ)音語(yǔ)料庫(kù)。實(shí)現(xiàn)了基于FP檢測(cè)和高斯混合隱馬爾科夫HMM-GMM模型的自然口語(yǔ)語(yǔ)音識(shí)別系統(tǒng)。對(duì)于不同測(cè)試集A和B,F(xiàn)P檢測(cè)模型的引入使得詞錯(cuò)誤率CER%平均下降
4、1.94和2.37。
(3)研究了基于TF-IDF的關(guān)鍵詞提取算法,針對(duì)病歷文本的特定結(jié)構(gòu)和內(nèi)容從病歷文本關(guān)鍵詞詞位置、詞性分布、文本分類(lèi)入手改進(jìn)了傳統(tǒng)TF-IDF算法。實(shí)驗(yàn)表明算法的Recall和Precision均能達(dá)到60%以上。在此基礎(chǔ)上,實(shí)現(xiàn)了基于病歷文本特征項(xiàng)余弦相似度的病歷文本自動(dòng)匹配。
(4)設(shè)計(jì)并實(shí)現(xiàn)了基于自然口語(yǔ)語(yǔ)音識(shí)別和關(guān)鍵詞自動(dòng)提取的EMR系統(tǒng)。該系統(tǒng)實(shí)現(xiàn)了口述醫(yī)學(xué)病歷的語(yǔ)音識(shí)別、關(guān)鍵詞自動(dòng)提
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于網(wǎng)絡(luò)監(jiān)聽(tīng)的關(guān)鍵詞識(shí)別系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 智能駕駛中關(guān)鍵詞識(shí)別系統(tǒng)的設(shè)計(jì)與仿真
- 大詞表自然語(yǔ)音關(guān)鍵詞識(shí)別系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 智能駕駛中關(guān)鍵詞識(shí)別系統(tǒng)的設(shè)計(jì)與仿真
- 基于HMM的中文語(yǔ)音關(guān)鍵詞識(shí)別系統(tǒng)的研究與開(kāi)發(fā).pdf
- 基于嵌入式的關(guān)鍵詞組識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于文本的關(guān)鍵詞提取方法研究與實(shí)現(xiàn).pdf
- 面向未知應(yīng)用的關(guān)鍵詞提取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于DHMM和VQ的關(guān)鍵詞識(shí)別研究與實(shí)現(xiàn).pdf
- 基于改進(jìn)的TFIDF關(guān)鍵詞自動(dòng)提取算法研究.pdf
- 連續(xù)語(yǔ)音關(guān)鍵詞識(shí)別系統(tǒng)中自適應(yīng)技術(shù)的研究.pdf
- 基于關(guān)鍵詞匹配的應(yīng)用識(shí)別與跟蹤.pdf
- 中等詞匯量的漢語(yǔ)連續(xù)語(yǔ)音關(guān)鍵詞識(shí)別系統(tǒng).pdf
- 基于關(guān)鍵詞的微博爬蟲(chóng)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 聲學(xué)模型的研究及在關(guān)鍵詞識(shí)別系統(tǒng)中的應(yīng)用.pdf
- 基于詞跨度的網(wǎng)頁(yè)關(guān)鍵詞提取方法研究.pdf
- 自動(dòng)語(yǔ)種識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于WEB頁(yè)面的關(guān)鍵詞與關(guān)鍵概念提取技術(shù).pdf
- 基于視頻的車(chē)型自動(dòng)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 車(chē)牌自動(dòng)識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論