版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、近年來,隨著電子技術(shù)、數(shù)字媒體和網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)碼相機(jī)、智能手機(jī)變得越來越廉價和普及,同時以圖像和視頻為主的可視媒體分享網(wǎng)站如Facebook、YouTube和Flickr等也越來越流行,互聯(lián)網(wǎng)上的可視媒體信息呈現(xiàn)爆炸式增長趨勢。在有力推動社交網(wǎng)絡(luò)、電子商務(wù)等互聯(lián)網(wǎng)業(yè)務(wù)繁榮發(fā)展的同時,這也引起了數(shù)據(jù)存儲、計算、傳輸、管理等操作上的困難。因此,針對可視媒體的智能分析與處理技術(shù)已經(jīng)成為信息技術(shù)創(chuàng)新的重要方向,也是契合重大社會需求的研究熱點
2、,其理論的創(chuàng)新和技術(shù)的突破將對可視媒體大數(shù)據(jù)資源的高效處理與有效利用產(chǎn)生深遠(yuǎn)影響,有望為互聯(lián)網(wǎng)企業(yè)的大數(shù)據(jù)業(yè)務(wù)形成切實的商業(yè)價值,開拓廣泛的應(yīng)用前景,其研究具有重大的理論價值和應(yīng)用意義。
本文圍繞可視媒體智能分析與處理的若干熱點問題,以可視媒體的結(jié)構(gòu)分析為主線,在可視媒體定制化重壓縮、本征圖像分解和人臉特征點定位等方面展開了相應(yīng)的研究,實現(xiàn)并應(yīng)用了相關(guān)算法,論文的主要創(chuàng)新點如下:
(1)提出了網(wǎng)絡(luò)海量圖片定制化重壓縮
3、框架。網(wǎng)絡(luò)圖片數(shù)量的爆炸式增長和圖像分辨率不斷增加占據(jù)了巨大的網(wǎng)絡(luò)帶寬資源及海量的媒體信息存儲空間。針對該問題,本文利用基于邊界連續(xù)、紋理等圖像結(jié)構(gòu)分析的方法實現(xiàn)對圖像質(zhì)量的客觀評價,并將圖像的主觀評價與客觀評價統(tǒng)一到一個框架中。該框架包括初始化、圖像重編碼、客觀質(zhì)量評估、流程控制、主觀評價、定制服務(wù)等六個模塊,能夠根據(jù)不同的應(yīng)用需求對網(wǎng)絡(luò)海量圖片進(jìn)行定制化的高效重壓縮,大幅減少網(wǎng)絡(luò)海量圖片運(yùn)營所需的帶寬及存儲成本,并提高用戶體驗。本方
4、法已經(jīng)在門戶網(wǎng)站、電子商務(wù)和在線游戲等相關(guān)互聯(lián)網(wǎng)圖片業(yè)務(wù)(易訊網(wǎng)、騰訊網(wǎng)、騰訊微博、SOSO地圖、互動娛樂等)中廣泛應(yīng)用,處理圖片總數(shù)突破1200億張,可節(jié)省大量的帶寬和運(yùn)營成本,提高用戶訪問速度與體驗。
?。?)提出基于L0稀疏優(yōu)化的本征圖像分解方法。從單張圖像提取其對應(yīng)的反射率、光照等本征結(jié)構(gòu)是個不適定的問題。本文針對圖像反射率的稀疏特性,利用L0范數(shù)來約束反射率梯度,使之是高頻和稀疏的,以此提取反射率中的主要結(jié)構(gòu)?;谠摲?/p>
5、射率稀疏先驗,利用貝葉斯理論對本征圖像分解進(jìn)行概率建模,將本征圖像分解問題轉(zhuǎn)換成極大化后驗概率問題。文章同時提出一個優(yōu)化方法對從后驗概率轉(zhuǎn)換得到的能量進(jìn)行最優(yōu)化求解,由于L0范數(shù)的不可微性,優(yōu)化方法通過引入輔助變量,以交替迭代的方式不斷的逼近最優(yōu)解。在MIT標(biāo)準(zhǔn)評測集、合成數(shù)據(jù)集和大量現(xiàn)實圖像上的結(jié)果顯示本文方法可顯著提升經(jīng)典Retinex方法的結(jié)果,達(dá)到國際先進(jìn)水平。
?。?)提出基于多尺度度量和稀疏性的本征圖像分解方法。針對
6、現(xiàn)實場景圖片復(fù)雜特性,在圖像反射率稀疏性先驗的基礎(chǔ)上,利用多尺度度量構(gòu)建圖像反射率內(nèi)部間的相互關(guān)系,對模型進(jìn)行約束,實現(xiàn)穩(wěn)定的求解。方法基于圖像內(nèi)容以自底向上的方式構(gòu)建圖像的不規(guī)則金字塔結(jié)構(gòu),將小尺度上具有相似色度特性的相鄰像素相連,也構(gòu)建大尺度上具有相似區(qū)域特性的遠(yuǎn)距離節(jié)點之間的相似度,最后以自頂向下的方式將高層的信息引入到模型中。進(jìn)一步,本文提出了模型的高效求解算法,算法一般在幾次迭代后就收斂。在一些標(biāo)準(zhǔn)評測數(shù)據(jù)集和各種自然場景圖像
7、上的實驗結(jié)果顯示,本文的方法算效率高,且在分解準(zhǔn)確度上超過了當(dāng)前的一些先進(jìn)算法,達(dá)到了先進(jìn)的水平。本文同時還將本征圖像分解的結(jié)果應(yīng)用于材質(zhì)編輯和顏色轉(zhuǎn)移等應(yīng)用中,得到了很好的結(jié)果。
(4)提出了基于L1稀疏約束的人臉配準(zhǔn)算法。人物圖片在網(wǎng)絡(luò)海量圖片中占據(jù)絕大多數(shù),并且處于相對活躍的狀態(tài),人臉特征點蘊(yùn)含著人臉的幾何結(jié)構(gòu)和豐富的語義信息,高效、魯棒的人臉配準(zhǔn)技術(shù)可為大規(guī)模人臉圖像檢索、可視媒體管理提供服務(wù)。本文對人臉形狀的變化比例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于可視搜索的交互式媒體技術(shù)研究.pdf
- 移動可視媒體智能處理與傳輸方法研究.pdf
- 基于媒體處理平臺的媒體網(wǎng)關(guān)實現(xiàn)技術(shù)研究.pdf
- 可視媒體交互與合成技術(shù)研究.pdf
- 聯(lián)機(jī)分析處理和可視化技術(shù)研究.pdf
- 基于移動智能終端的視像信號處理技術(shù)研究.pdf
- 可視媒體編輯與重用關(guān)鍵技術(shù)研究.pdf
- 基于ABAQUS的智能有限元分析前處理技術(shù)研究.pdf
- 基于圖像處理技術(shù)的缺陷智能檢測技術(shù)研究及應(yīng)用.pdf
- 智能調(diào)度大數(shù)據(jù)的可視化技術(shù)研究.pdf
- 基于潛在語義分析的智能搜索技術(shù)研究.pdf
- 搜索結(jié)果智能處理技術(shù)研究.pdf
- 基于FPGA的智能視頻信號處理技術(shù)研究.pdf
- 可視媒體素材管理與編輯關(guān)鍵技術(shù)研究.pdf
- 作物形態(tài)結(jié)構(gòu)的可視化技術(shù)研究.pdf
- 基于社交媒體的人物分析技術(shù)研究.pdf
- 可視媒體素材管理與編輯關(guān)鍵技術(shù)研究
- 基于Radviz算法的金融數(shù)據(jù)可視化分析技術(shù)研究.pdf
- 基于流媒體技術(shù)的智能終端的研究.pdf
- PCB故障智能診斷與可視化技術(shù)研究.pdf
評論
0/150
提交評論