版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、<p> 分類號密 級</p><p> UDC編 號</p><p> 碩 士 專 業(yè) 學(xué) 位 論 文</p><p> 基于隨機(jī)森林的遙感影像云影信息檢測方法研究</p><p> 研究生姓名:</p><p> 學(xué)號:</p><p> 指導(dǎo)教師姓名、職稱:</p>
2、<p> 專業(yè)類別(領(lǐng)域):輕工技術(shù)與工程</p><p> 年 月</p><p><b> 摘 要</b></p><p> 隨著我國國產(chǎn)遙感衛(wèi)星陸續(xù)發(fā)射成功并投入運行,遙感影像在越來越多的行業(yè)領(lǐng)域得到應(yīng)用,發(fā)揮著重要的作用。光學(xué)遙感衛(wèi)星傳感器在成像過程中極有可能受到云層的干擾,遙感影像上經(jīng)常會成對出現(xiàn)由云及其投影
3、帶來的不規(guī)則高亮區(qū)域以及暗淡的陰影區(qū)域,使相應(yīng)的拍攝地域目標(biāo)信息丟失或受到干擾。這降低了目標(biāo)檢測、識別和地物分類的準(zhǔn)確性,對遙感影像的判讀解譯和應(yīng)用帶來不利影響。</p><p> 隨機(jī)森林是一種基于決策樹的監(jiān)督學(xué)習(xí)算法,在泛化能力和分類精度上均優(yōu)于單一決策樹,并且具有良好的魯棒性,因此隨機(jī)森林算法已成功應(yīng)用于遙感影像分類。本文研究基于隨機(jī)森林的遙感影像自動云影信息檢測方法,設(shè)計實現(xiàn)影像云及云影信息的自動檢測方
4、法,本文主要工作為:</p><p> (1)分析遙感影像中云、云影、地物的光譜和紋理特征,在傳統(tǒng)的光譜、紋理特征基礎(chǔ)上,加入了基于Sobel算子的邊緣特征,以描述影像中邊緣的幅度特性,構(gòu)建有效區(qū)分云、云影、地物的特征組合。</p><p> ?。?)利用遙感影像降采樣得到的遙感影像快視圖,采集云影區(qū)域、云區(qū)域、地物影像分塊處理得到訓(xùn)練樣本,提取樣本特征集,利用隨機(jī)森林算法訓(xùn)練影像分類器
5、。</p><p> ?。?)使用隨機(jī)森林影像分類器對待測遙感影像進(jìn)行分類,得到云、云影、地物分類結(jié)果,接著對分類的各區(qū)塊進(jìn)行形態(tài)學(xué)閉運算,處理不同類區(qū)域相互重疊的情況,得到最終的分類結(jié)果,確定云和云影區(qū)域位置;</p><p> ?。?)構(gòu)建遙感影像測試集,通過改變隨機(jī)森林訓(xùn)練參數(shù)進(jìn)行分類器的訓(xùn)練與分類實驗,確定最優(yōu)的隨機(jī)森林參數(shù);針對分類器將較亮地物識別為云,將紋理平滑地物識別為霧的情
6、況,增加對云、霧區(qū)域的“二次檢測”;針對分類器將較暗地物識別為云影的情況,增加云影空間方位判定,以修正檢測結(jié)果,提高檢測精度;并對本文方法和優(yōu)化改進(jìn)后的方法進(jìn)行精度評價。 </p><p> 本文在國產(chǎn)衛(wèi)星的遙感影像測試集上進(jìn)行云影信息檢測試驗,試驗結(jié)果表明,本文方法可以較為準(zhǔn)確地檢測到遙感影像中的云影信息,具有精度較高、運行速度較快、不依賴輔助數(shù)據(jù)的優(yōu)點。</p><p> 關(guān)鍵詞:
7、隨機(jī)森林;云影檢測;影像分類;特征提取 </p><p><b> Abstract</b></p><p> With the successful launch of remote sensing satellites in our country, remote sensing images are becoming ever more and more i
8、mportant in more and more industries. However, optical satellites will inevitably be affected by clouds and fogs in the process of imaging, the remote sensing images often appear in pairs from the cloud and its projectio
9、n to bring the irregular highlight area and the dim shadows, so that the target information of the corresponding geographical area is lost or disturbed. </p><p> Random Forest is an effective supervised lea
10、rning algorithm with high classification accuracy and good robustness, which has stronger generalization ability and classification effect than single Decision Tree. Therefore, the Random Forest algorithm has been succes
11、sfully applied to classification application of remote sensing images.</p><p> This thesis researched the automatic cloud shadow information detection method based on Random Forest algorithm, which utilized
12、 the computer to realize the automated detection of cloud and cloud shadow. To achieve the research goal, the following work have been done in this paper:</p><p> (1) The spectral and texture features of cl
13、oud, cloud shadow, and fog in remote sensing images are analyzed. On the basis of traditional spectral and texture features, edge features based on Sobel operator are added to describe the amplitude characteristics of th
14、e edges in remote sensing images, and the feature combination of cloud, cloud shadow and terrain is effectively constructed.</p><p> (2) Segmentation processing of the fast view images, which was generated
15、by down-sampling processing of corresponding original remote sensing data, was be taken to extract the features of cloud shadow area, cloud area and terrain area sub-images. Then, train the shadow-cloud-fog image classi
16、fier with the sample features, using Random Forest algorithm.</p><p> (3) Shadow-cloud-fog image classifier was utilized to classify the target remote sensing images and obtain classification of the cloud,
17、cloud shadow, and terrain images. Then, morphological block operations are performed on each images block of the classified area, then, cloud and cloud shadow area location was determined by area overlap detection.</p
18、><p> (4) Test set of remote sensing images was established, and the training and classification of the classifier tests are carried out by setting different Random Forest parameters to find the optimal parame
19、ters. In the case where the classifier recognizes the brighter terrain as cloud or the smooth terrain as fog, the "secondary detection" of cloud and fog areas was added; in the case where the classifier recogni
20、zes the darker terrain as cloud shadow, spatial direction judging method was taken to c</p><p> The performance assessment of the cloud shadow detection method and optimized one which proposed by this paper
21、 was carried out under domestic satellite remote sensing images set. The experimental results show that the method in this paper detects the cloud shadow information in remote sensing image fairly accurately, and has the
22、 advantages of high precision, fast arithmetic speed, and independent of auxiliary data.</p><p> Keywords: Random Forests; Cloud Shadow Detection; Image Classification; Feature Extraction</p><p&
23、gt;<b> 目 錄</b></p><p><b> 摘 要I</b></p><p> AbstractII</p><p><b> 1 概述1</b></p><p> 1.1 研究背景及意義1</p><p> 1
24、.2 國內(nèi)外研究現(xiàn)狀分析2</p><p> 1.2.1遙感影像云影信息檢測研究現(xiàn)狀分析4</p><p> 1.2.2 隨機(jī)森林方法在遙感影像處理中的研究現(xiàn)狀分析4</p><p> 1.3 本文主要研究內(nèi)容6</p><p> 2云、云影、霧影像特征提取方法7</p><p> 2.1 遙感影像
25、實驗數(shù)據(jù)集7</p><p> 2.2 云、云影、霧影像特征分析及提取8</p><p> 2.2.1 灰度、顏色特征9</p><p> 2.2.2 紋理特征11</p><p> 2.2.3 邊緣特征14</p><p> 3 隨機(jī)森林算法分析17</p><p>
26、3.1 隨機(jī)森林算法原理17</p><p> 3.1.1 監(jiān)督學(xué)習(xí)方法原理17</p><p> 3.1.2 決策樹模型20</p><p> 3.1.3 CART決策樹的生成21</p><p> 3.1.4 隨機(jī)森林的構(gòu)造21</p><p> 3.2 隨機(jī)森林算法性能特點23</p&
27、gt;<p> 4 基于隨機(jī)森林的云影檢測方法24</p><p> 4.1 基于隨機(jī)森林的云影信息檢測實驗24</p><p> 4.1.1 云影信息檢測方法流程24</p><p> 4.1.2 云影信息檢測技術(shù)實現(xiàn)26</p><p> 4.1.3 云影信息檢測實驗結(jié)果27</p><
28、;p> 4.2 參數(shù)設(shè)置對分類器訓(xùn)練的影響29</p><p> 4.2.1 隨機(jī)森林模型參數(shù)29</p><p> 4.2.2 隨機(jī)森林參數(shù)與分類誤差的關(guān)系29</p><p> 4.3 云影信息檢測方法優(yōu)化30</p><p> 4.3.1 云影信息檢測方法存在的問題30</p><p>
29、 4.3.2 優(yōu)化的云影信息檢測方法流程32</p><p> 4.3.3 優(yōu)化方法的云影信息檢測結(jié)果33</p><p> 5 云影檢測結(jié)果精度評價35</p><p> 5.1 云影檢測精度評價方法35</p><p> 5.1.1 云影檢測精度主觀評價方法35</p><p> 5.1.2
30、云影檢測精度客觀評價方法35</p><p> 5.2 云影檢測方法優(yōu)化前后對比37</p><p> 5.2.1 優(yōu)化前后云影檢測結(jié)果37</p><p> 5.2.2 優(yōu)化前后檢測精度主觀評價38</p><p> 5.2.3 優(yōu)化前后檢測精度客觀評價399</p><p> 6 總結(jié)與展望4
31、0</p><p> 6.1 研究總結(jié)40</p><p> 6.2 研究展望41</p><p><b> 參考文獻(xiàn)42</b></p><p> 攻碩期間發(fā)表的科研成果目錄46</p><p><b> 致 謝47</b></p>
32、<p><b> 1 概述</b></p><p> 1.1 研究背景及意義</p><p> “遙感”一詞最早出現(xiàn)于20世紀(jì)60年代,指的是非接觸的遠(yuǎn)距離探測技術(shù)。目前廣泛應(yīng)用的典型遙感技術(shù)是基于衛(wèi)星平臺的成像遙感技術(shù),在這種遙感技術(shù)系統(tǒng)中,遙感衛(wèi)星攜帶的傳感器獲取目標(biāo)物發(fā)射或反射的各波段電磁輻射,再將電磁輻射轉(zhuǎn)換為數(shù)字圖像形式的衛(wèi)星遙感影像,獲取的
33、遙感影像通過無線信道傳輸?shù)降孛?,?jīng)過一定的影像處理解譯,得到可以使用的目標(biāo)信息。在對地觀測時,衛(wèi)星遙感技術(shù)具有觀測范圍廣、觀測限制少、運行周期短、可動態(tài)監(jiān)測等獨特優(yōu)勢[1],這是人工現(xiàn)場測量和航空攝影測量無法相比的。近年來隨著衛(wèi)星遙感技術(shù)的迅速發(fā)展,越來越多的民用遙感衛(wèi)星系統(tǒng)投入運行,特別是一系列國產(chǎn)遙感衛(wèi)星發(fā)射成功,遙感影像信息在我國經(jīng)濟(jì)建設(shè)中的應(yīng)用程度大大提高,在測繪制圖、國土資源普查、土地覆蓋分類、氣象觀察預(yù)測、農(nóng)作物監(jiān)控估產(chǎn)、災(zāi)
34、害監(jiān)測評估等領(lǐng)域得到廣泛應(yīng)用[2,3,4]。尤其是可見光遙感衛(wèi)星影像,它的空間分辨率較高,顏色信息豐富,利于目視判讀,已經(jīng)成為應(yīng)用最廣泛的民用遙感數(shù)據(jù)類型[5]。</p><p> 然而,光學(xué)遙感衛(wèi)星在成像過程中會不可避免地受到云霧的影響,云及其投影的存在,直接阻礙了地面區(qū)域遙感影像的獲取,極大影響了遙感影像的應(yīng)用。據(jù)統(tǒng)計,地球上平均有預(yù)計66%的地區(qū)被云層覆蓋[6],即使我國濕度最小的西北地區(qū)平均云覆蓋也接近
35、30%[7]。所以,在遙感影像上會出現(xiàn)由云帶來的不規(guī)則高亮區(qū)域以及云影及不規(guī)則暗淡區(qū)域,使相應(yīng)的拍攝地域目標(biāo)信息丟失或受到干擾,降低了目標(biāo)檢測、識別和地物分類的準(zhǔn)確性,對遙感影像的解譯與應(yīng)用帶來不利影響[4,8,9,10]。對于含有部分云以及云影的影像,如果完全不使用,則造成了衛(wèi)星資源的浪費,以及有效影像拍攝成本的增加[11],因此,消除云和云影是提高遙感影像質(zhì)量以及影像利用效率的一個重要手段,而其前提就是遙感影像中云和云影信息的檢測。
36、</p><p> 最早應(yīng)用的云和云影信息檢測方法是人工目視解譯,利用判讀人員的先驗知識去標(biāo)記云和云影的范圍,相比于計算機(jī)解譯,人工解譯精度較高且靈活性好,可以識別各種復(fù)雜情況下的云和云影,因此被廣泛應(yīng)用。然而,遙感影像目視解譯結(jié)果取決于判讀人員的主觀判斷,不同判讀人員對同一影像中云和云影的判讀結(jié)果存在差異[12],遙感影像中云形態(tài)多變,地物背景變化復(fù)雜,對于多光譜遙感影像,云影通常會減少受云層陰影影響的地面區(qū)
37、域?qū)μ栞椛涞姆瓷?,使得云影區(qū)域在影像中的亮度很低,使得云影區(qū)域與水體、其他陰影或其他暗目標(biāo)在可見光波段的光譜特征很相似,容易被混淆[13],目視解譯很難具備可重復(fù)性。另外,隨著我國 “高分辨率對地觀測”重大專項的推進(jìn)以及國家遙感對地觀測體系的不斷建設(shè),遙感衛(wèi)星成像性能和無線傳輸能力越來越強,衛(wèi)星影像數(shù)據(jù)量快速增長[14]。以中國科學(xué)院遙感與數(shù)字地球研究所為例,其下屬的密云遙感衛(wèi)星地面站覆蓋接收面積達(dá)到國土面積的80%,可以接收15顆國
38、內(nèi)、外遙感衛(wèi)星傳來的數(shù)據(jù)[15]。在2008年接收國內(nèi)外遙感衛(wèi)星數(shù)據(jù)共計36.91萬景[14],同期處理能力卻不超過200景/日。可見,依靠目視解譯來進(jìn)行大批量遙感影</p><p> 機(jī)器學(xué)習(xí)的一大應(yīng)用就是分類問題,而遙感影像云影信息檢測問題可以理解為將影像分為云、云影、霧、地物四類的分類問題,所以可以用機(jī)器學(xué)習(xí)的方法解決。機(jī)器學(xué)習(xí)可以讓計算機(jī)在沒有明確編程的情況下做出基于學(xué)習(xí)的判斷,通過計算機(jī)模擬人的學(xué)習(xí)行
39、為,學(xué)習(xí)新的知識,并通過改變參數(shù)驗證學(xué)習(xí)效果,對所學(xué)知識重新組織和優(yōu)化,提高分類精確度、泛化能力等性能[2]。</p><p> 機(jī)器學(xué)習(xí)方法在語音識別、計算機(jī)視覺、搜索引擎、自然語言處理、醫(yī)學(xué)診斷等領(lǐng)域應(yīng)用廣泛,取得了顯著成果,早已得到理論和實踐上的認(rèn)可。云影信息檢測通過選取云、云影、地物在影像中的灰度、紋理等特征,利用計算機(jī)進(jìn)行監(jiān)督學(xué)習(xí)得到分類模型,快速對大批量待測遙感影像中的云、云影和地物進(jìn)行預(yù)測和識別,
40、提高云影檢測的時效性。隨機(jī)森林是目前流行的機(jī)器學(xué)習(xí)算法之一,其分類精度優(yōu)異,訓(xùn)練速度快,泛化能力好,魯棒性強[16],在遙感影像處理領(lǐng)域被大量應(yīng)用。</p><p> 本文以實現(xiàn)遙感影像中云影信息的自動檢測為目的,研究了基于隨機(jī)森林的遙感影像云影信息檢測方法,并通過對該方法檢測的云影區(qū)塊進(jìn)行形態(tài)學(xué)變換、云影空間方位判斷,減少云影區(qū)域錯檢,提高檢測精度。</p><p> 1.2 國內(nèi)外
41、研究現(xiàn)狀分析</p><p> 1.2.1 遙感影像云影信息檢測研究現(xiàn)狀分析</p><p> 遙感影像中的云影具有一些顯著的特點,在光譜方面,由于入射光被云團(tuán)遮擋,導(dǎo)致地面只有較小的光譜能量反射到遙感傳感器,云影區(qū)域在遙感影像上表現(xiàn)為灰度均值較低,直方圖能量值較小,容易與水體以及山脈陰影的光譜特征相混淆[17]。在形狀方面,由于云影是云的投影,在空間關(guān)系上,云、云影通常成對出現(xiàn)且保持
42、特定的方位位置關(guān)系,并且出現(xiàn)具有隨機(jī)性,與地物的情況一般沒有直接關(guān)系;這些因素決定了在形狀方面,云影呈現(xiàn)出與云相同的特點,即多為團(tuán)塊狀且形狀極不規(guī)則,難以有效表達(dá)。</p><p> 利用云影的這些特點,很多學(xué)者對于影像中云及云影的檢測和識別已經(jīng)提出了諸多方法,概括起來,主要有下列四類:</p><p> 第一類是波段差異法,這種方法利用單景數(shù)據(jù)不同波段對云的敏感性差異進(jìn)行圖像運算與處
43、理來確定云的區(qū)域,再利用云與云影的相對位置關(guān)系檢測云影。</p><p> Li等人[18]研究了單景Landsat影像中無云區(qū)地物在第一波段和第三波段影像的特性,利用這兩個波段影像高度相關(guān)的特點確定了云的區(qū)域,再計算附近像元相對云區(qū)邊緣的偏移距離(HOT),根據(jù)HOT的大小來判定是否是薄云或者云影,實現(xiàn)云影的自動探測。Zhu和Woodcock[19,20] 主要利用了Landsat的近紅外NIB波段(Near
44、 Infrared Band)影像,將該波段影像進(jìn)行Flood-fill種子填充變換,之后與原波段影像比較找到大致的云影區(qū)域,再將已經(jīng)找到的云團(tuán)與云影團(tuán)塊匹配,確定云影區(qū)域。沈金祥等人研究了單景Landsat 8影像中的云及云影協(xié)同檢測方法,應(yīng)用紅、短波紅外、熱紅外三個波段的信息,利用SAM(光譜角制圖)方法得到云光譜特征曲線,再分別結(jié)合短波紅外、熱紅外波段像元值篩除冰雪區(qū)域以及其他地物區(qū)域的干擾得到云像元,最后,對云區(qū)掩碼定向移動,并
45、匹配近紅外波段亮度閾值,檢測出與云區(qū)對應(yīng)的云影區(qū)域。但是這種方法利用的是經(jīng)驗閾值,只能處理在同一類大氣情況下的遙感影像,所以不能實現(xiàn)批量化的云及云影檢測。</p><p> 波段差異法利用單景數(shù)據(jù),比較簡單,也有不錯的效果,但前提條件較高[21],波段較少的衛(wèi)星影像數(shù)據(jù)受到限制[8],閾值的設(shè)置也收到經(jīng)驗的限制,云影檢測的自動化程度不高。</p><p> 第二類是多時相比較法,這種方
46、法依據(jù)同一地區(qū)不同時相的多幅影像進(jìn)行小波融合等運算來檢測云影。Jin等人[22]利用同一地域不同時相的含云和無云Landsat ETM+影像數(shù)據(jù)分別作為目標(biāo)影像和參考影像,利用兩景影像的藍(lán)色、短波紅外和熱紅外波段光譜信息進(jìn)行運算來獲取大致的云影區(qū)域,再進(jìn)一步處理得到準(zhǔn)確的云影區(qū)域。Pyongsop等人[23]利用Landsat影像數(shù)據(jù)云影在多波段光譜各波段的光譜特征,建立云影地域增強模型初步定位影像中的云影,再對無云參考影像進(jìn)行圖像配準(zhǔn)
47、,找到差異區(qū)域 ,對差異區(qū)域進(jìn)行非監(jiān)督分類,篩選初步定位結(jié)果,實現(xiàn)了云影的檢測。</p><p> 多時相比較法需要選取同一區(qū)域的無云參考影像,且要求這一時段內(nèi)區(qū)域的地物變化不大,最好是要用不同年份同一季節(jié)或者近時相的數(shù)據(jù),其檢測效果取決于無云參考影像與待檢測影像的相似程度[24,25],而且需要對無云數(shù)據(jù)進(jìn)行精確的配準(zhǔn)和校正[26],并設(shè)置判別規(guī)則排除真實地物的光譜變化,導(dǎo)致這種方法處理周期比較長,不適用于大
48、量遙感影像的自動云影信息檢測。</p><p> 第三類是濾波法,這種方法利用單景影像,通過均值、低通、高通、小波[27]、同態(tài)[28]等不同算子進(jìn)行頻率域圖像處理以消除云及云影,適用于處理大范圍存在薄云及其投影的情況。</p><p> Zhang等人[28]針對薄云色調(diào)過渡均和,紋理結(jié)構(gòu)簡單,在影像頻率域中是低頻信息這一特點,通過小波變換將影像轉(zhuǎn)化到頻率域進(jìn)行處理,再用同態(tài)濾波處理
49、影像的低頻近似分量,消除云及云影,最后使用小波重構(gòu)將影像轉(zhuǎn)換回到空間域,得到處理后的影像。</p><p> 濾波法原理簡單、操作方便,但這種方法由于涉及濾波器結(jié)構(gòu)以及截止頻率的選擇,不僅處理有云的區(qū)域,同時也影響非云區(qū)域,使灰度信息受到損失,造成不必要的信息丟失。</p><p> 第四類是幾何關(guān)系法,這種方法利用云與云影之間的相對位置關(guān)系檢測云及其投影。Hégarat-M
50、ascle 和André[29]利用云及其投影形狀、面積相似且相對位置關(guān)系固定的特點,在對影像進(jìn)行通道間校準(zhǔn)等預(yù)處理之后,分別在像元以及云團(tuán)實體兩個層次建立馬爾可夫隨機(jī)場,進(jìn)行云和云影的分類檢測。Jin等人[22]利用Landsat TM和ETM+傳感器影像的藍(lán)、短波紅外、熱紅外三個波段的光譜信息來檢測影像中的云及云影,再利用云和云影之間的地理位置相關(guān)性來判斷云影是否有對應(yīng)的云團(tuán)實體,從而篩除錯檢的云影,得到更高準(zhǔn)確率的檢測結(jié)
51、果。作者在5景Landsat測試影像上進(jìn)行算法試驗,像元級的檢測準(zhǔn)確率達(dá)到93.9%以上,但并沒有在影像數(shù)量更大的遙感影像數(shù)據(jù)集上進(jìn)行測試。</p><p> 幾何關(guān)系法可有效避免云影與其它光譜類似地物的混淆,在預(yù)處理找出的大致云影區(qū)域的基礎(chǔ)上定位云影,但這類方法模型復(fù)雜,涉及的參數(shù)較多,需與其它方法結(jié)合[30],也涉及到經(jīng)驗性閾值的設(shè)置,不能適用于自動的云影檢測。</p><p>
52、目前,云影檢測技術(shù)正向著高精度、高效率的方向發(fā)展。這些方法各有特色又各有局限性,在同時滿足高效率和高精度的平衡上,四種檢測方法都有不足之處。因此,綜合利用遙感影像的灰度、紋理特征以及云和云影呈現(xiàn)的成對出現(xiàn)、同一影像中相對方位一致的特點,避免云影在可見光波段中與水體、地物陰影的光譜相似性對檢測結(jié)果的影響,利用機(jī)器學(xué)習(xí)方法在速度和效率方面的優(yōu)勢,研究基于機(jī)器學(xué)習(xí)的云影信息自動檢測方法,并提高檢測的效率和精度,是目前云影信息檢測的一大發(fā)展趨勢
53、。</p><p> 1.2.2 隨機(jī)森林方法在遙感影像處理中的研究現(xiàn)狀分析</p><p> 隨機(jī)森林(Random Forest,RF)算法由美國科學(xué)院院士Leo Breiman等人在2001年提出[31]。隨機(jī)森林分類器由CART分類與回歸決策樹通過Bootstrap方法集成得到,其結(jié)構(gòu)簡潔,可以處理具有高維度特征的海量數(shù)據(jù),分類準(zhǔn)確性高,有很好的魯棒性,且訓(xùn)練和分類速度快,這些
54、特性決定了隨機(jī)森林在較復(fù)雜的高維度大批量樣本分類問題中具有很大的優(yōu)越性。</p><p> 作為一種監(jiān)督學(xué)習(xí)分類方法,隨機(jī)森林在遙感影像處理領(lǐng)域很自然地被直接應(yīng)用到土地覆蓋分類等分類應(yīng)用中[32]。</p><p> 國外方面,美國的Ham等人[33]用隨機(jī)森林分類器對在樣本數(shù)量較少的情況下,改進(jìn)隨機(jī)森林的節(jié)點分裂方法,訓(xùn)練基于二元分裂決策樹的隨機(jī)森林,完成高光譜遙感影像土地覆蓋分類,
55、發(fā)現(xiàn)RF比傳統(tǒng)方法在高光譜影像地物分類中有更強的泛化能力;比利時的Chan和Paelinckx[34]利用Adaboost、隨機(jī)森林兩種方法對含有126個波段的航空高光譜影像進(jìn)行生態(tài)區(qū)土地植被覆蓋分類,并將兩種方法的分類準(zhǔn)確率與神經(jīng)網(wǎng)絡(luò)方法的準(zhǔn)確率比較,發(fā)現(xiàn)隨機(jī)森林和Adaboost方法都有70%左右的準(zhǔn)確率,比神經(jīng)網(wǎng)絡(luò)方法提高了10%;其中,隨機(jī)森林訓(xùn)練最快、最穩(wěn)定。Rodriguez-Galiano等人[35]利用隨機(jī)森林算法對西班
56、牙Granada地區(qū)的以植被覆蓋為主的14類地物進(jìn)行了分類試驗,并探究了訓(xùn)練參數(shù)對模型訓(xùn)練誤差的影響,得到了泛化能力最優(yōu)的分類模型,分類測試中的各類總體分類精度達(dá)到92%,指數(shù)達(dá)到0.92。德國的Wurm等人[36]利用TerraSAR-X衛(wèi)星的雙極化合成孔徑雷達(dá)(dual-polarized Synthetic Aperture Radar)數(shù)據(jù)對大城市中貧民窟區(qū)域進(jìn)行變化檢測,實現(xiàn)對</p><p> 國內(nèi)
57、方面,武漢大學(xué)的孫洪團(tuán)隊[37]利用隨機(jī)森林進(jìn)行極化SAR影像上的地物分類,結(jié)合兩種新提出的組合特征策略,在ALOS PALSAR影像上進(jìn)行分類測試并與其它分類器比較,證明隨機(jī)森林分類器在訓(xùn)練和分類花銷時間更少的同時,性能也更優(yōu)。Guo等人[38]將LiDar(Light Detection And Ranging)機(jī)載激光探測數(shù)據(jù)和航空多光譜影像相結(jié)合,基于隨機(jī)森林進(jìn)行城市分類;利用隨機(jī)森林可以給出特征重要性的性能特色,通過大量數(shù)據(jù)的
58、訓(xùn)練測試過程,給出了不同地物類別的各個特征對分類的重要性程度,證實了LiDar和多光譜數(shù)據(jù)在聯(lián)合運用中的重要相關(guān)性。劉毅等人[39]將隨機(jī)森林方法應(yīng)用于國產(chǎn)小衛(wèi)星的遙感影像分類,通過在HJ-1、BJ-1的多光譜遙感影像集上的試驗表明,隨機(jī)森林在運行穩(wěn)定性,分類精度和運算速度等方面較支持向量機(jī)、最大似然法等分類方法表現(xiàn)更優(yōu)秀。</p><p> 以上的眾多基于隨機(jī)森林的遙感應(yīng)用研究表明,目前隨機(jī)森林在來自衛(wèi)星或者
59、航空遙感平臺的多光譜影像、全色影像、LiDar數(shù)據(jù)、SAR數(shù)據(jù)、高光譜影像以及多源數(shù)據(jù)組合上,在遙感變化監(jiān)測、遙感土地覆蓋使用等方面有廣泛的應(yīng)用,并且在分類性能上有更優(yōu)良的表現(xiàn),因而隨機(jī)森林在應(yīng)用中有著顯著的研究價值。</p><p> 1.3 本文主要研究內(nèi)容</p><p> 本文以自動檢測衛(wèi)星遙感影像中云及云影信息為目的,分析了隨機(jī)森林在遙感影像處理中的研究應(yīng)用現(xiàn)狀以及近幾年遙感
60、影像云影信息檢測研究的進(jìn)展,發(fā)現(xiàn)隨機(jī)森林方法可以應(yīng)用于包括多光譜、全色數(shù)據(jù)在內(nèi)的各種遙感影像,并且具有泛化能力強、分類精度高、運算速度快、支持海量數(shù)據(jù)的優(yōu)點;而現(xiàn)有的云影檢測方法在檢測精度和運行效率兩方面都各自有局限性,不能在效率和精度上取得平衡。</p><p> 所以,本文基于隨機(jī)森林算法對遙感影像云影信息檢測問題進(jìn)行了研究,提出了基于隨機(jī)森林的遙感影像云影信息檢測方法,并對其進(jìn)行了改進(jìn)。</p>
61、;<p> 本文主要研究內(nèi)容如下:</p><p> (1)研究遙感影像云、云影區(qū)域有效特征提取方法</p><p> 本文通過觀測和特征提取實驗,分析全色、多光譜遙感影像中云、云影、霧區(qū)域的光譜和紋理特征,根據(jù)云、云影、霧區(qū)域呈現(xiàn)的不同特點,選擇灰度均值、灰度方差、一階差分、直方圖信息熵等光譜特征,以及基于灰度共生矩陣的逆差矩、對比度、角二階矩和自相關(guān)性,以及分形維數(shù)
62、等紋理特征;在傳統(tǒng)的光譜、紋理特征基礎(chǔ)上,加入了基于Sobel算子的邊緣特征,以描述影像中邊緣的幅度特性,構(gòu)建有效區(qū)分云、云影、地物的特征組合。</p><p> ?。?)研究基于隨機(jī)森林的云影信息檢測方法</p><p> 本文在對隨機(jī)森林原理以及隨機(jī)森林構(gòu)造過程的研究基礎(chǔ)上,設(shè)計了基于隨機(jī)森林的云影信息檢測方法:首先,通過提取云、云影影像樣本集中的有效特征矢量,進(jìn)行隨機(jī)森林訓(xùn)練實驗,
63、找到最優(yōu)隨機(jī)森林訓(xùn)練參數(shù),得到影像云影區(qū)塊分類器;接著,使用分類器對待測影像進(jìn)行分類,得到云和云影的分類區(qū)塊,對云和云影區(qū)塊進(jìn)行形態(tài)學(xué)閉運算,再去除形態(tài)學(xué)運算后不同類區(qū)域相互重疊的情況,得到最終的云和云影區(qū)域位置。</p><p> ?。?)研究改進(jìn)的云影信息檢測方法</p><p> 本文在基于隨機(jī)森林的云影檢測方法得到的云、云影分類結(jié)果基礎(chǔ)上,針對分類器將較亮地物識別為云、將部分紋理
64、平滑地物識別為霧的情況,增加對云區(qū)域“二次檢測”;針對分類器將較暗地物識別為云影的情況,增加云影空間方位判斷,以修正檢測結(jié)果,提高檢測精度。并對比分析改進(jìn)后方法在精度上的提升,證明改進(jìn)的有效性。</p><p> 2云、云影、霧影像特征提取方法</p><p> 利用隨機(jī)森林算法實現(xiàn)對遙感影像中云影的檢測,首先要建立實驗數(shù)據(jù)集,并構(gòu)建有效區(qū)分云、云影、地物的特征組合。本章將介紹用于本文
65、實驗的遙感影像實驗數(shù)據(jù)集,并分析遙感影像中云、云影、地物的灰度、紋理和邊緣特征,研究與各特征對應(yīng)的特征提取方法。</p><p> 2.1 遙感影像實驗數(shù)據(jù)集</p><p> 考慮到遙感影像云影信息檢測方法研究的實用意義,本文以國產(chǎn)遙感影像為 實驗數(shù)據(jù),檢測影像中的云影分布。分別選取近幾年發(fā)射的四顆國產(chǎn)衛(wèi)星的全色(PAN)和多光譜(MSS)遙感影像作為實驗數(shù)據(jù),數(shù)據(jù)來自中國資源衛(wèi)星應(yīng)
66、用中心、國家測繪地理信息局衛(wèi)星測繪應(yīng)用中心和北京國測星繪信息技術(shù)有限公司,分別是高分一號(GF-1)、高分二號(GF-2)的多光譜影像數(shù)據(jù),以及資源三號(ZY-3)、資源一號02C(ZY02C)的全色影像數(shù)據(jù)。四顆衛(wèi)星發(fā)射時間分別是2013年4月、2014年8月、2012年1月、2011年12月,代表了我國在軌光學(xué)遙感衛(wèi)星的最高技術(shù)水平。 </p><p> 本文實驗數(shù)據(jù)中,GF-1號衛(wèi)星PMS傳感器的多光譜遙
67、感影像437幅,拍攝區(qū)域覆蓋北京、天津、河北;GF-2號衛(wèi)星PMS傳感器多光譜遙感影像389幅,拍攝區(qū)域主要是河北、山西; ZY-3號衛(wèi)星NAD傳感器的全色遙感影像270幅,拍攝區(qū)域主要是內(nèi)蒙古; ZY-02C號衛(wèi)星HRC傳感器的全色遙感影像280幅,拍攝區(qū)域是北京、天津以及遼寧部分區(qū)域。影像中的地物包括了山脈、森林、平原、城市、湖泊等多種類型,在這樣的數(shù)據(jù)集上進(jìn)行云影檢測方法的實驗和優(yōu)化,有利于提高本文方法在不同背景影像中的云影檢測精
68、度。</p><p> 本文實驗的衛(wèi)星遙感影像數(shù)據(jù)的獲取時間等信息如表2-1所示,由表2-1可見,每種遙感影像的獲取時間范圍均至少包含四個季度,影像中會出現(xiàn)各種各樣的云和云影,實驗數(shù)據(jù)的豐富有利于提高本文方法在不同氣象情況下云影檢測的精度。</p><p> 表2-1 本文遙感影像數(shù)據(jù)列表</p><p> 2.2 云、云影、霧影像特征分析及提取</p&
69、gt;<p> 本文使用基于隨機(jī)森林的云影檢測方法,以影像分類的方式檢測影像中的云影,分類檢測精度同時取決于云檢測的精度,霧和云雖然相似,但其在影像中往往沒有明顯的投影,所以單獨列為一類影像。并且,影像分類器訓(xùn)練過程中,每個輸入實例就是某樣本所有特征值組成的特征矢量,因此,首先需要構(gòu)建有效的特征組合以及對應(yīng)的提取方法,獲取特征組合矢量。本節(jié)對實驗影像集中的云、云影、霧在光譜特征和紋理特征兩方面進(jìn)行分析,給出各特征值的計算
70、方法,并在此基礎(chǔ)上,提出基于Sobel算子的邊緣特征描述符,形成最終的特征組合矢量。</p><p> 如圖2-1所示為實驗數(shù)據(jù)中各遙感衛(wèi)星的云、云影、霧區(qū)域影像樣本。</p><p> (a) GF-1、GF-2、ZY-3、ZY2-02C云樣本</p><p> (b) GF-1、GF-2、ZY-3、ZY2-02C云影樣本</p><p&
71、gt; (c) GF-1、GF-2、ZY-3、ZY2-02C霧樣本</p><p> 圖2-1 各衛(wèi)星云、云影、霧影像樣本</p><p> 2.2.1 灰度、顏色特征 </p><p> 2.2.1.1 灰度、顏色特征分析</p><p> 對于遙感影像來說,光譜特征是最底層的一項特征,在特征提取中,一般采用顏色、灰度特征來描述影
72、像的光譜特征。</p><p> 云一般是由水滴或冰晶凝結(jié)而成,太陽光照向云層將會被反射、吸收和散射, 隨著云層厚度的增加,云對太陽光的反射和吸收能力增強,導(dǎo)致到達(dá)地表的光能量大幅減小而形成投影,在遙感影像上表現(xiàn)為云和云影。雖然霧也是由大氣中的大量水滴形成,但云與霧在光學(xué)特性上不同的是,由于地表反射的太陽光不能穿透云層到達(dá)傳感器,所以遙感影像的云區(qū)只有云的影像;而霧由于比云更加稀薄,入射的太陽光和地表反射光穿透
73、霧的同時發(fā)生明顯的米氏散射,以至于到達(dá)傳感器的地表反射光能量降低,并且包含了地物和霧的混合信息。</p><p> 對于霧區(qū)域,在遙感影像上一般表現(xiàn)為模糊且質(zhì)量退化的圖像,原因主要是兩方面:一是剛剛分析到的反射光能量降低,二是未經(jīng)地面反射的太陽光散射后混雜于地面反射光。霧天大氣散射模型如圖2-2所示,即傳感器接收的光來自兩部分,一是被霧散射而減弱的地表反射光;二是入射地表時遇霧發(fā)生散射后被傳感器直接接收的部分太
74、陽光。</p><p> 圖2-2 霧天大氣散射模型</p><p> 對比圖2-1中云、霧樣本也可以看出,云樣本的亮度均值水平比霧樣本高,并且,霧樣本邊緣不清晰,并且會含有模糊的地表信息,這就是由于各自成像機(jī)制不同而在遙感影像上的具體體現(xiàn)。</p><p> 按照形成方式不同,陰影可以分為本影和投影兩大類[40],對于遙感成像而言,云影即是云遮擋了太陽光,從
75、而在地球表面形成的投影,云影區(qū)域由于入射的可見光波段太陽輻射被云層大量遮擋、反射,因此云影區(qū)反射進(jìn)入遙感衛(wèi)星傳感器的能量也較小,區(qū)域灰度均值低,對于多光譜影像,顏色接近于黑色。正因為如此,云影的光譜特征與水體以及建筑物、山脈陰影的光譜特征比較相似,如圖2-3所示。</p><p> (a)云影區(qū)域 (b)水體區(qū)域 (c)山脈陰影</p><p> 圖2-3 云影與其他較暗的影像區(qū)域&l
76、t;/p><p> 但是,由于水體對可見光的選擇性吸收并非在各個波段都是相同的,所以,水體的像素值偏藍(lán),圖2-3(b)中的湖泊區(qū)域RGB三通道灰度均值(1,8,18);云一般是白色的,對可見光的反射在各波段接近于相同,但是仍會有少量光透過,云影區(qū)域的顏色偏向地物區(qū)域影像顏色,例如,圖2-3(a)中的云影區(qū)域RGB三通道灰度均值為(18,6,6),偏紅;山脈和高大建筑由于完全不透光,所以這種陰影區(qū)域顏色會偏向于純黑,
77、圖2-3(c)中陰影區(qū)域RGB三通道灰度均值為(6,6,7)。綜上,在灰度、顏色特征方面,云影與水體、地物陰影區(qū)域存在著差異,但不夠明顯,可以考慮在提取特征之前進(jìn)行線性拉伸等預(yù)處理。</p><p> 2.2.1.2 灰度、顏色特征提取</p><p> 由于地物的復(fù)雜性,云的多樣性,以及季節(jié)、天氣的不同,導(dǎo)致遙感影像中的云以及云的投影復(fù)雜多樣[17]。在應(yīng)用中,僅僅通過一個特征是無法
78、有效描述云和云影目標(biāo)特性的,因此本文使用多種特征形成多維特征矢量來描述每一個樣本影像。</p><p> 對于灰度圖像而言,最基本的特征就是每一個像素點的灰度值,灰度特征在運算上比較簡單,但往往能夠直觀有效的反映圖像在亮度、顏色方面的特性,本文選用灰度均值、灰度方差、一階差分、直方圖信息熵作為灰度特征矢量。</p><p><b> (1) 灰度均值</b><
79、;/p><p> 樣本影像的灰度均值計算公式為:</p><p><b> (式2-1)</b></p><p> 其中, 是影像處的灰度值,M是圖像的長,N是圖像的高。本公式既可以計算RGB三通道內(nèi)的3個灰度均值,也可以計算灰度圖的1個灰度均值。灰度均值反映了云、云影、地物之間的整體亮度差異,對于光學(xué)遙感影像,一般來說,大部分云區(qū)亮度較高,
80、大部分地物亮度較低。</p><p><b> (2)灰度方差</b></p><p> 樣本影像的灰度方差計算公式為:</p><p><b> ?。ㄊ?-2)</b></p><p> 灰度方差反映了影像整體灰度的分布均勻程度,或者說灰度分布的離散程度。</p><p&
81、gt;<b> ?。?)一階差分</b></p><p> 樣本影像的一階差分計算公式為:</p><p><b> ?。ㄊ?-3)</b></p><p> 一階差分描述圖像相鄰像素之間的分布差異,反映了影像中灰度變化的劇烈程度。</p><p><b> (4)直方圖信息熵<
82、;/b></p><p> 樣本影像的直方圖信息熵計算公式為:</p><p><b> ?。ㄊ?-4)</b></p><p> 其中,是圖像的直方圖,是在某灰度級下像素占所有像素的分布頻率,直方圖信息熵綜合反映了影像不同灰度值分布的概率情況,熵值越低,影像灰度值分布越均勻。</p><p> 2.2.2
83、紋理特征</p><p> 2.2.2.1 紋理特征分析</p><p> 紋理是數(shù)字圖像處理中的常用特征,指圖像內(nèi)部色調(diào)和方向有規(guī)律的變化,并以一定的頻率重復(fù)出現(xiàn)造成的小形狀結(jié)構(gòu)。能夠反映目標(biāo)表面的質(zhì)感,具有光滑、平滑、粗糙等視覺特征,例如,城市,農(nóng)田,山脈分別呈現(xiàn)格點狀,條帶狀,褶皺狀紋理特征,如圖2-4。</p><p> 紋理一般可以分為規(guī)則紋理和自然
84、紋理,遙感印象中更多出現(xiàn)的是自然紋理,它并沒有明確的紋理基元,是內(nèi)部某色調(diào)在空間中重復(fù)出現(xiàn)形成的可被感知的規(guī)律變化,這種重復(fù)在局部小范圍很難觀察,只有在整體層面發(fā)現(xiàn)它的存在。</p><p> (a)云 (b)農(nóng)田 (c)城市 (d)山脈</p><p> 圖2-4 不同影像區(qū)域的紋理特點</p&g
85、t;<p> 對于云而言,不同高度、不同厚度的云灰度相差較大。水汽含量、高空大氣環(huán)境等不確定因素導(dǎo)致云的形態(tài)千變?nèi)f化,在影像上體現(xiàn)為紋理的多樣性。由圖2-1(a)可見,云樣本紋理多變,在局部層面難以觀察到明顯紋理,然而,遙感影像中的云在整體層面呈現(xiàn)出光滑而有層次的紋理質(zhì)感,與局部范圍的灰度變化相比具有自相似性。另外,云區(qū)內(nèi)部灰度變化緩慢,灰度梯度幅度不大,整體來看紋理特征較弱。正因為云區(qū)呈現(xiàn)出這兩點紋理特性,因此使用紋理
86、特征描述云影像是有意義的。</p><p> 對于霧而言,霧對光的散射使得它展現(xiàn)出和云不太一樣的紋理表現(xiàn),相比于云的紋理,霧區(qū)紋理特征更為規(guī)則。如圖2-1(b)所示,霧因為是一種模糊的影像,所以其邊緣信息很弱,看上去比較平滑,呈現(xiàn)出一種模糊混沌的主觀質(zhì)感。</p><p> 云影區(qū)域幾乎不具備明顯的紋理特征,本特征主要描述云影像,利用隨機(jī)森林方法更準(zhǔn)確的檢測云的分布,從而利用云的分布來
87、輔助判斷云影分布。</p><p> 2.2.2.2 紋理特征提取</p><p> 對于遙感影像中自然紋理呈現(xiàn)的紋理特征,主要通過統(tǒng)計分析方法加以提取,提取方法主要包括分形維數(shù)方法,灰度共生矩陣法。</p><p><b> ?。?)分形維數(shù)方法</b></p><p> 分形維數(shù)基于分形幾何理論[41],利用影
88、像自相似性強弱描述不規(guī)則形狀圖像的紋理特征。遙感圖像中的云整體上是不規(guī)則的,但在細(xì)小的局部尺度上卻又是相似的,具備自相似性,滿足了分形幾何特征,因此將分形維數(shù)提取為描述云影像的一個紋理特征參數(shù)。然而,分形維數(shù)的理論定義過于復(fù)雜, 其解析值很難計算,并且在應(yīng)用中近似值也足以起到特征描述符的作用,因此,本文使用計盒維數(shù)法[42]求分形維數(shù)的近似值。</p><p> 本文算法流程為:設(shè)圖像灰度級數(shù)為,取一組尺度值,
89、按將圖像切分成的網(wǎng)格,設(shè),每個網(wǎng)格是一組高為的盒子。設(shè)網(wǎng)格中最大灰度級和最小灰度級分別落在盒子和中,則賦給該網(wǎng)格的所有灰度值,需要盒子數(shù)量為:</p><p><b> (式2-5) </b></p><p> 累加得到整個圖像的盒子個數(shù):</p><p><b> (式2-6)</b></p><
90、;p><b> 分形維數(shù)的值即為:</b></p><p><b> (式2-7)</b></p><p> 本文選擇值為4,8,16,將得到的三組,值繪制在直角坐標(biāo)系,用最小二乘法擬合三個點數(shù)據(jù),得到的一次函數(shù)斜率就是分形維數(shù)值。</p><p> 分形維數(shù)特征反映出圖像中紋理的復(fù)雜程度。局部區(qū)域紋理也是不
91、規(guī)則,值越大;對于云圖來說,灰度變化平緩,紋理細(xì)節(jié)少,往往較小。地表物體紋理反復(fù)復(fù)雜,往往較大。</p><p> (2)灰度共生矩陣方法</p><p> 本文選擇了以下五個基于灰度共生矩陣的二次統(tǒng)計值來作為紋理特征值,首先計算得到歸一化的灰度共生矩陣,再通過提取以下值:</p><p><b> 1)對比度</b></p>
92、<p><b> (式2-8)</b></p><p><b> 2)角二階矩</b></p><p><b> (式2-9)</b></p><p><b> 3)自相關(guān)</b></p><p><b> (式2-10)
93、</b></p><p><b> 4)逆差矩</b></p><p><b> (式2-11)</b></p><p> 其中,是矩陣中行標(biāo)為,列標(biāo)為的元素,,分別是的均值和標(biāo)準(zhǔn)差,的計算方式為,,分別是矩陣每列和每行之和。</p><p> 關(guān)于各個二次特征的意義,當(dāng)對比度越
94、大,或角二階矩越大時,圖像紋理特征越明顯;當(dāng)自相關(guān)越小,逆差矩越大,紋理特征的變化越不明顯;反之亦然。</p><p><b> (5) 信息熵</b></p><p><b> (式2-12)</b></p><p> 因為是歸一化的,所以矩陣中的每一個值本身就是概率值,因此信息熵的計算公式得以簡化。</p&
95、gt;<p> 2.2.3 邊緣特征</p><p> 由于云和地物的復(fù)雜性和多樣性,僅僅使用上述灰度、顏色、紋理特征區(qū)分度較差。實驗發(fā)現(xiàn),山地等部分地物區(qū)域使用上述特征容易造成錯判。</p><p> 通過目視比較大量容易錯判的云與地物,發(fā)現(xiàn)它們雖然灰度、顏色、紋理特征存在很大相似性,但是邊緣特征存在較明顯的差別。山地等地物的邊緣通常表現(xiàn)得更明顯,邊緣梯度較大;云的邊
96、緣則不清晰,表現(xiàn)得較為模糊,在局部中,邊緣梯度小,變化緩慢。為了利用數(shù)值描述邊緣差異,提高特征組合對云、云影、地物的區(qū)分能力,本文提出了基于Sobel算子的邊緣特征用于云影檢測,包括邊緣幅度最大值和邊緣幅度均值兩個特征。另外,由于影像局部灰度范圍窄,如圖2-5,2-6所示,云區(qū)亮度均值較高,直接提取邊緣得到的邊緣信息不明顯,提取邊緣之前,本文對影像進(jìn)行線性拉伸處理,將子圖灰度范圍拉伸到最大,以放大邊緣特征,進(jìn)而提取到的邊緣特征值區(qū)分度更
97、高。 </p><p> 本文基于Sobel算子提取邊緣幅度最大值和幅度均值特征的方法步驟如下:</p><p> ?。?)對樣本圖像進(jìn)行線性拉伸,將子圖灰度范圍線性拉伸至0到255區(qū)間,得到拉伸處理之后的圖像;</p><p> (2)利用三階Sobel邊緣檢測算子對進(jìn)行水平和垂直方向的卷積運算,求取邊緣圖像。設(shè)和分別是經(jīng)水平和垂直方法邊緣檢測之后的邊緣圖像,
98、計算公式為:</p><p><b> (式2-13)</b></p><p><b> (式2-14)</b></p><p><b> (式2-15)</b></p><p> ?。?)計算邊緣特征:</p><p><b> (式
99、2-16)</b></p><p><b> (式2-17)</b></p><p> 為了驗證這兩個邊緣特征的有效性,選取部分灰度特征非常相似的云和地物樣本進(jìn)行特征比較分析,所選典型樣本分別,歸一化后的樣本的各項特征值分布情況散點圖如圖2-7所示,其中,圖2-7(a)~(b)為歸一化的灰度特征分布,圖2-7(c)~(d)為歸一化的紋理特征分布,圖2-
100、7(e)~(f)為歸一化的邊緣分布。</p><p> 圖2-5 典型云類樣本</p><p> 圖2-6 對比地物樣本</p><p> 除此之外,圖2-7(g)~(h)給出了不經(jīng)線性拉伸預(yù)處理的情況下,提取到的邊緣特征分布。由圖2-7可以看出,這兩類樣本的灰度特征分布區(qū)域大部分是重疊的,這意味著灰度特征很難區(qū)分兩類影像;分形維數(shù)等紋理特征雖能夠區(qū)分部分兩類
101、樣本,但效果不夠顯著。而由圖2-7(e)和圖2-7(f)可見,兩類影像的邊緣特征分布區(qū)域交集相比其他特征分布情況減小了很多,尤其是邊緣最大值特征,能顯著區(qū)分云類和地物子圖,說明本文提出的邊緣特征能夠較好的區(qū)分云和地物。對比圖2-7(g)和圖2-7(h)中不進(jìn)行拉伸預(yù)處理 的情況,本文提出的經(jīng)線性拉伸后提取的邊緣特征,將云和地物的特征分布區(qū)分得更開,區(qū)分云和地物的能力大大提高,說明線性拉伸處理是有效的,反過來,這也充分說明了本文提出的基于
102、Sobel算子的兩個邊緣特征的有效性。</p><p> 圖2-7 歸一化的特征分布</p><p> 3 隨機(jī)森林算法分析</p><p> 隨機(jī)森林算法(Random Forest,RF)由Breiman等人在2001年提出[31],它以CART決策樹算法(Breiman,1984)為基礎(chǔ),是一種由多棵CART決策樹集成的機(jī)器學(xué)習(xí)算法。區(qū)別于其他的決策樹集
103、成學(xué)習(xí)算法,RF算法在生成單棵樹的過程中,訓(xùn)練子集獲取、節(jié)點特征選擇是完全隨機(jī)的,具有很好的泛化能力,由于整個決策樹森林輸出“過擬合”程度降低,對訓(xùn)練樣本中的噪聲有很好的魯棒性,降低了測試誤差,使訓(xùn)練得到的RF分類器有很強的穩(wěn)定性。本章通過研究隨機(jī)森林的基本原理和學(xué)習(xí)過程,為利用隨機(jī)森林算法進(jìn)行云、影分類以及隨機(jī)森林分類器的訓(xùn)練優(yōu)化奠定理論基礎(chǔ)。</p><p> 3.1 隨機(jī)森林算法原理</p>
104、<p> 3.1.1 監(jiān)督學(xué)習(xí)方法原理</p><p> 遙感影像中的云、云影區(qū)域的多維特征矢量值具有統(tǒng)計規(guī)律性,這些特征矢量就能夠作為監(jiān)督學(xué)習(xí)所用的數(shù)據(jù),這也是本文利用隨機(jī)森林方法解決云影信息檢測問題的前提條件。</p><p> 3.1.1.1 監(jiān)督學(xué)習(xí)問題的形式化</p><p> 監(jiān)督學(xué)習(xí)分為學(xué)習(xí)和預(yù)測兩個過程,分別由學(xué)習(xí)系統(tǒng)和預(yù)測系統(tǒng)實
105、現(xiàn),可以用圖3-1描述。</p><p> 圖3-1 監(jiān)督學(xué)習(xí)問題</p><p> 首先給定訓(xùn)練數(shù)據(jù)集,其中,是樣本點。是第個樣本的特征矢量,是該樣本的分類標(biāo)簽。</p><p> 在學(xué)習(xí)系統(tǒng)中,學(xué)習(xí)算法利用訓(xùn)練數(shù)據(jù)集中的樣本點,訓(xùn)練得到模型,對于隨機(jī)森林或者決策樹算法來說,得到的是為非概率模型,可以表示為決策函數(shù)(decision function):[4
106、3] </p><p><b> (式3-1)</b></p><p> 對于具體的輸入輸出實例,分別寫作</p><p><b> (式3-2)</b></p><p> 由于機(jī)器學(xué)習(xí)中的決策樹方法在用于分類時可以理解為一種決策函數(shù),而隨機(jī)森林可以理解為決策函數(shù)集,所以本文只討論非概率模型
107、的情況。</p><p> 在學(xué)習(xí)過程中,學(xué)習(xí)系統(tǒng)對于輸入的產(chǎn)生一個輸出,而樣本集中對應(yīng)的輸出是.在預(yù)測過程中,對于測試樣本集中的輸入,由模型給出的輸出是,而實際的輸出是。我們把訓(xùn)練樣本的輸出與模型輸出之間的差稱為訓(xùn)練誤差(training error),把測試樣本的輸出與模型輸出之間的誤差稱為測試誤差(test data)。</p><p> 3.1.1.2 測試誤差與模型評估<
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于改進(jìn)隨機(jī)聚類決策森林算法的遙感影像分類研究.pdf
- 作物長勢遙感監(jiān)測研究-碩士論文
- 基于jseg算法的彩色遙感圖像分割_碩士論文
- 《基于邊緣檢測的細(xì)胞圖像分割方法研究與實現(xiàn)》碩士論文
- 基于隨機(jī)森林的致病SNPs檢測方法研究.pdf
- 隨機(jī)森林及其在遙感影像處理中應(yīng)用研究.pdf
- 基于遙感影像的道路信息提取方法研究.pdf
- 基于協(xié)議分析的入侵檢測系統(tǒng)碩士論文
- 基于隨機(jī)森林的遙感圖像分類算法研究.pdf
- 基于示教的加工中心在線檢測研究---碩士論文
- 基于示教的加工中心在線檢測研究---碩士論文
- 基于Markov隨機(jī)場的遙感影像分割研究.pdf
- 用于中醫(yī)診療的智能信息處理方法研究---碩士論文
- 用于中醫(yī)診療的智能信息處理方法研究---碩士論文
- 基于微博網(wǎng)絡(luò)的信息傳播模型研究-碩士論文
- 基于分層結(jié)構(gòu)的遙感影像變化檢測方法研究.pdf
- 基于隨機(jī)森林的惡意移動應(yīng)用動態(tài)檢測方法研究.pdf
- 10172.基于空間信息準(zhǔn)確性增強的遙感影像變化檢測方法研究
- 碩士論文-基于脈沖噪聲檢測的圖像去噪研究
- 遙感影像的陰影檢測與補償方法研究.pdf
評論
0/150
提交評論