2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在目前這個信息化的世界中,信息的傳遞顯得尤為重要,其中文字信息在現(xiàn)實環(huán)境中隨處可見,而識別其中的文本信息對獲取周圍環(huán)境的信息具有非常重要的作用,所以文字識別技術在近年來受到越來越多的重視?,F(xiàn)有的較為通用的文字識別技術OCR的局限性在于:OCR只能處理背景單一的文字圖片。在實際生活應用中,待識別的文字圖片往往是直接來源于成像設備捕捉的自然場景圖片,該類圖片的特點是背景復雜且不可預測,如果直接將此種圖片作為OCR的輸入進行識別,效果往往是不

2、盡人意的。自然地,自然場景文字識別作為計算機視覺技術中的一種較為年輕的學科在近年來發(fā)展得非常迅速。
  作為最常見的文字識別類型,英文識別的應用最為廣泛。如何對輸入圖片進行預處理,并對處理后的圖片來提取特征、訓練分類器、抑制錯誤結果和對最終結果進行判別和修正,是英文文字識別中的一些值得深入研究的問題。基于對上述問題的考慮,及對結合近年的英文文字識別的方法的研究,本文對自然場景英文文字識別進行相關研究,主要內容有:
  1.提

3、出了基于類間錯分率的模糊類別劃分方案,本文通過計算目前最為通用的是62類英文字符分類的兩兩樣本間的錯分概率,對類別進行了模糊處理,通過降低類別空間,本方法從根本上提高了初始分類精度。
  2.提出了基于圖像分割的方法預處理方法,對輸入待識別的自然場景圖片使用圖像分割方法進行預處理,結合預處理結果,提出分離置信度SC的計算公式,并結合字符的縱橫比統(tǒng)計信息抑制大量滑動窗口,最終將分離置信度加入所有的識別結果候選序列的最終識別分數(shù)的計算

4、中,得到一系列分數(shù)較高的識別結果。
  3.提出了基于大樣本字典的定量修正識別單詞的準則,對目前現(xiàn)有的根據(jù)字典信息對識別結果進行修正的方法進行了改進。確定了根據(jù)識別結果中不同字符數(shù)的不同修正方法,并通過大量實驗證明了本文提出的識別方法具有較好的識別精度和運行速度。
  本文提出的自然場景英文字符識別方法準確度高,基于重新給定樣本空間的方法,提高了分類器的分類精度,且基于縱橫比的子窗口抑制方法更為合理地將子窗口數(shù)量降低了2個數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論