面向字符識別的圖像壓縮和語義質(zhì)量評估.pdf_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著移動多媒體應用的興起,人們對互聯(lián)網(wǎng)的需求已經(jīng)不再僅限于信息交流、圖片共享等,而是利用互聯(lián)網(wǎng)的豐富資源(比如計算能力、存儲資源以及數(shù)據(jù)資源等)去獲取更多有用的信息,比如通過移動端采集圖像,發(fā)送到云端做圖像檢索、目標識別等計算機視覺任務。然而,由于網(wǎng)絡傳輸帶寬有限,為了降低在諸如此類移動-云計算系統(tǒng)中圖像的傳輸碼率,我們需要重新定義基于多媒體應用的圖像編碼以及圖像質(zhì)量評價。與傳統(tǒng)的圖像編碼和圖像質(zhì)量評價不同,本文提出了以下兩種新型方案來

2、節(jié)約碼率。
  首先,我們從編碼本身入手。由于壓縮圖像是用于自動識別等任務而不是供人眼欣賞,因此在壓縮時我們不再關注視覺質(zhì)量,而是假定與識別目標相關的語義特征的質(zhì)量更為重要。據(jù)了解,尺度不變特征變換(Scale InvariantFeature Transform,SIFT)特征已廣泛應用于各種目標識別場景,最近也已經(jīng)有很多關于保留SIFT的壓縮編碼方法的工作。本文中,我們首次研究了保留SIFT特征的新型圖像編碼方案,這一方案主要

3、針對信宿是計算機視覺算法而不是人眼視覺。我們根據(jù)提取的SIFT特征,將圖像劃分成SIFT編碼單元(目標區(qū)域)和非SIFT編碼單元(非目標區(qū)域),并用修改后的JPEG對圖像進行壓縮編碼,壓縮時對不同的編碼單元設置不同的質(zhì)量參數(shù)。實驗結(jié)果表明,在不影響識別精度的前提下,我們的壓縮方法平均比標準JPEG節(jié)約14%左右的碼率。
  另一方面,我們通過設計可靠的圖像語義質(zhì)量評價(Image Semantic QualityAssessmen

4、t,ISQA)指標來指導編碼,最優(yōu)化編碼效率。基于上述信宿是計算機視覺算法而不是人眼的應用場景,我們假定壓縮圖像的質(zhì)量應該由圖像壓縮后保留的相關語義特征的質(zhì)量來衡量,而不是像素保真度(例如Peak Signal-to-Noise Ratio,PSNR)或者視覺質(zhì)量(例如Structural Similarity Index Measure,SSIM)。本文中,我們研究了基于SIFT特征的ISQA方法,首先提取壓縮前后圖像的特征(SIFT

5、特征和稠密SIFT特征),并結(jié)合統(tǒng)計學習的方法對壓縮前后特征的失真進行建模,建立特征失真度與壓縮圖像質(zhì)量之間的映射關系,根據(jù)模型的兩種誤判類型的代價不同定義傳輸代價函數(shù),求解在給定預測精度前提下,壓縮時的最佳操作點,并統(tǒng)計在不同操作點下壓縮圖像的平均碼率。實驗結(jié)果表明,我們提出的ISQA方法在評估壓縮的車牌圖像(或路標圖像)能否被識別這方面要比PSNR和SSIM的性能高很多,將我們的壓縮方法應用到車牌(或路標)壓縮系統(tǒng)中,比PSNR或S

6、SIM至少提高58%(37%)的壓縮性能。此外,我們還研究了在路標圖像能否識別上,我們提出的ISQA方法與人眼是否一致。實驗結(jié)果顯示,我們的ISQA算法與人眼主觀評價之間的皮爾森線性相關系數(shù)(Pearson Linear Correlation Coefficient,PLCC)達到0.8401,而均方根誤差(Root Mean Squared Error,RMSE)低至0.5325,表明我們提出的ISQA算法在文本圖像識別上與人眼有高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論