2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、<p><b>  判別分析論文</b></p><p>  作 者 鄺淑芳 </p><p><b>  目 錄</b></p><p><b>  第一章 判別分析</b></p><p>  §1.1什么是判別

2、分析3</p><p>  §1.2判別分析的分類.3</p><p>  §1.3判別分析的適用條件3</p><p>  §1.4判別分析的方法3</p><p><b>  第二章 距離判別法</b></p><p>  §2.1什么是距離判別

3、法4</p><p>  §2.2馬氏距離4</p><p>  §2.3兩個總體的判別4</p><p>  §2.4多個總體的判別5</p><p>  第三章 貝葉斯判別法</p><p>  §3.1什么是貝葉斯判別法6</p><p>

4、  §3.2貝葉斯判別的方法6</p><p>  §3.3最大后驗概率法6</p><p>  §3.4最小期望誤判法6</p><p>  第四章 費希爾判別法</p><p>  §4.1什么是費希爾判別法6</p><p>  §4.2費希爾判別法的基本

5、思想7</p><p>  §4.3費希爾判別函數(shù)和準則7</p><p>  §4.4費希爾判別法的步驟8</p><p><b>  第五章 案列分析</b></p><p>  §5.1距離判別法10</p><p>  §5.2貝葉斯判別法

6、13</p><p>  §5.3費希爾判別法14</p><p><b>  附錄16</b></p><p><b>  第一章.判別分析</b></p><p>  §1.1什么是判別分析</p><p>  判別分析,是一種統(tǒng)計判別和分組技術,

7、就一定數(shù)量樣本的一個分組變量和相應的其他多元變量的已知信息,確定分組與其他多元變量信息所屬的樣本進行判別分組。用數(shù)學的語言來說,判別問題可以表述為:對于個樣品,每個樣品有個指標,已知每個樣品屬于某一類別(總體),對于每類別其分布函數(shù)分別為,對于一個給定樣品,我們要判斷出這個樣本來自哪個總體。判別分析的主要問題就是如何尋找最佳的判別函數(shù)和建立判別規(guī)則。</p><p>  §1.2判別分析的分類</

8、p><p>  根據(jù)判別中的組數(shù),可以分為兩組判別分析和多組判別分析;</p><p>  根據(jù)判別函數(shù)的形式,可以分為線性判別和非線性判別;</p><p>  根據(jù)判別式處理變量的方法不同,可以分為逐步判別、序貫判別等;</p><p>  根據(jù)判別標準不同,可以分為距離判別、貝葉斯判別、費希爾判別等。</p><p>

9、;  §1.3判別分析的適用條件</p><p>  自變量服從正態(tài)分布。</p><p>  自變量之間沒有多重共線性。</p><p>  每個變量在各類中的取值應存在顯著差異。</p><p>  §1.4判別分析的方法</p><p> ?。ū疚闹饕榻B三種方法,其它方法暫不討論) <

10、;/p><p><b>  距離判別法。</b></p><p><b>  貝葉斯判別法。</b></p><p><b>  費希爾判別法。</b></p><p><b>  .距離判別法</b></p><p>  §

11、2.1什么是距離判別法</p><p>  距離判別法是最為直觀,其想法自然、簡單,就是計算新樣品到各組的距離,然后將該樣品判為離它距離最近的一組。</p><p><b>  §2.2馬氏距離</b></p><p>  關于在判別分析中使用的距離問題,因為歐式距離未能將變量之間通常存在的相關性考慮在內(nèi),故不太理想,而馬氏距離卻能很

12、好的彌補這種不足,因此在判別分析中通常使用馬氏距離。</p><p>  對于一個均值為μ,協(xié)方差矩陣為Σ的多變量向量,點到總體的平方馬氏距離為:。</p><p>  §2.3兩個總體的判別</p><p>  ①當Σ1=Σ2=Σ時的判別(Σ是協(xié)方差矩陣):</p><p>  判別規(guī)則:計算到兩個組的平方馬氏距離,按距離最近原則

13、判別,則可總結為:</p><p>  判別函數(shù):為兩組距離判別的判別函數(shù),又稱為線性判別函數(shù),稱為判別系數(shù)向量。,其中是兩個組均值的平均值,。</p><p>  那么判別規(guī)則可簡化為:</p><p>  誤判概率:用表示來自而誤判為的概率;用表示來自而誤判為的概率;即</p><p>  用表示這兩組之間的馬氏距離,因此兩個組越是分開(

14、即越大),誤判的概率就會越小,此時的判別效果越佳。當兩個組很接近時,誤判概率將很大,這時做判別分析就沒有什么實際意義。</p><p> ?、诋敠?≠Σ2時的判別</p><p>  判別規(guī)則:計算到兩個組的平方馬氏距離,按距離最近原則判別,則可總結為:</p><p>  判別函數(shù): 相應的判別規(guī)則為:</p><p>  §2.

15、4多個總體的判別</p><p>  設有個組,它們的均值分別是協(xié)方差矩陣分別是。</p><p>  到的總體平方馬氏距離:. 判別規(guī)則:</p><p><b>  ,判別規(guī)則簡化為:</b></p><p>  其中.此時為線性判別函數(shù)。</p>

16、<p>  實際中一般都是未知的。</p><p><b> ?、贂r,可估計為,</b></p><p>  的聯(lián)合無偏估計為,其中為組數(shù),為每組的樣本個數(shù),,組的樣本協(xié)方差矩陣。</p><p> ?、诓蝗嗟葧r,,可估計為,</p><p><b>  的聯(lián)合無偏估計為。</b>&l

17、t;/p><p>  第三章.貝葉斯判別法</p><p>  §3.1什么是貝葉斯判別法</p><p>  如果對多個總體的判別考慮的不是建立判別式,而是計算新給樣品屬于各總體的條件概率,比較這個概率的大小,然后將樣品判歸為來自概率最大的總體,這種判別方法稱為貝葉斯判別方法。</p><p>  §3.2貝葉斯判別的方法&

18、lt;/p><p><b>  最大后驗概率法</b></p><p><b>  最小期望誤判代價法</b></p><p>  §3.3最大后驗概率法</p><p>  基本思想:設有個組,且組的概率密度為樣品來自組的先驗概率為滿足。根據(jù)貝葉斯公式,屬于的后驗概率(即當樣品已知時,它屬于

19、的概率)為.</p><p><b>  判別規(guī)則:.</b></p><p>  §3.4最小期望誤判代價法</p><p>  最大后驗概率法只考慮到了先驗概率,忽略了誤判代價,該方法等價于誤判代價相同時的最小期望誤判代價法,此時的總誤判概率達到最小,也可稱為最小總誤判概率法。</p><p>  第四章.

20、費希爾判別法</p><p>  §4.1什么是費希爾判別法</p><p>  Fisher判別是一種先進行高維向低位投影,再根據(jù)距離判別的一種方法。借助方差分析的思想構造判別函數(shù)(相當于一種投影),使組間區(qū)別最大、組內(nèi)離差最小,然后代入新樣本數(shù)據(jù),將其與判別臨界值比較以確定應判為至哪一總體。</p><p>  §4.2費希爾判別法的基本思想

21、</p><p>  它的基本思想是通過將多維數(shù)據(jù)投影到某一方向上,使得投影后類與類之間盡可能的分開,然后再選擇合適的判別準則,將待判的樣本進行分類判別。而衡量類與類之間是否分開的方法是借助于一元方差分析的思想,利用方差分析的思想來導出判別函數(shù)。</p><p>  §4.3 費希爾判別函數(shù)和判別準則</p><p>  (在以下討論中,我們需假定各組的協(xié)

22、方差矩陣相同,即.)</p><p>  設來自組的維觀測值為,,,將它們共同投影到某一維常數(shù)向量上,得到的投影點可分別對應線性組合,,。這樣,所有的維觀測值就簡化為一維觀測值。下面我們用表示組中的均值,表示所有組的總均值,即 </p><p><b>  式中。</b></p><p>  的組間平方和:,式中為組間平方和及叉積和矩陣。

23、</p><p>  的組內(nèi)平方和:,式中為組內(nèi)平方和及叉積和矩陣。</p><p>  設的全部非零特征值依次為,相應的特征向量依次記為。當時達到最大值。所以,選擇投影到上能使各組的投影點最大限度地分離,稱為費希爾第一線性判別函數(shù),簡稱第一判別函數(shù)。</p><p>  有時僅僅使用第一判別函數(shù)是不夠的,我們應該考慮建立第二個線性組合,我們在約束條件下尋找,使得達

24、到最大。當時達到最大值,稱為費希爾第二線性判別函數(shù),簡稱第二判別函數(shù)。</p><p>  在約束條件下尋找,使得達到最大。當時達到最大值,稱為第判別函數(shù),。</p><p>  表明了第判別函數(shù)對分離各組的貢獻大小,在所有個判別函數(shù)中的貢獻率為。</p><p>  而前個判別函數(shù)的累計貢獻率為。</p><p>  它表明了能代表進行判別

25、的能力。</p><p><b>  判別規(guī)則為:。</b></p><p>  有時我們也使用中心化的費希爾判別函數(shù),即。</p><p>  §4.4 費希爾判別的步驟</p><p> ?、儆筛鹘M樣本資料,計算各組樣本均值;</p><p><b>  ②計算組間矩陣;&

26、lt;/b></p><p><b>  ③計算組內(nèi)矩陣;</b></p><p> ?、苡嬎憔仃嚨那疤卣髦?;</p><p><b>  ⑤構造判別函數(shù)。</b></p><p>  案列分析:1991年30個省、市、自治區(qū)城鎮(zhèn)居民月平均收人數(shù)據(jù)表</p><p>&

27、lt;b>  單位:元/人</b></p><p>  x1:人均生活費收入 x6:人均各種獎金、超額工資(國有+集體)</p><p>  x2:人均國有經(jīng)濟單位職工工資 x7:人均各種津貼(國有+集體)</p><p>  x3:人均來源于國有經(jīng)濟單位標準工資

28、 x8:人均從工作單位得到的其他收入</p><p>  x4:人均集體所有制工資收入 x9:個體勞動者收入</p><p>  x5:人均集體所有制職工標準工資</p><p>  變量個數(shù)p=9,兩類總體各有11個樣品,即n1=n2=11 ,有2個待判樣品。一</p><p><b>  一、距離

29、判別法</b></p><p>  用SAS的proc corr程序算出第一、二組的均值和與協(xié)方差矩陣和,詳細代碼見附錄程序①。</p><p><b>  Σ的聯(lián)合估計為</b></p><p>  然后利用SAS算出判別函數(shù),詳細代碼見附錄程序②。</p><p>  于是我們得到判別函數(shù):</p&

30、gt;<p>  那么對于廣東和西藏兩個待判地區(qū):</p><p> ?、賹τ趶V東,計算得 所以依據(jù)馬氏距離判別法,應該把廣東判為第一組。</p><p> ?、趯τ谖鞑?,計算得 所以依據(jù)馬氏距離判別法,應該把西藏判為第一組。</p><p> ?、刍卮Y果:從下表可以得知誤判概率為0</p><p>  ④交叉驗證結果:從

31、下表得知</p><p>  將第一組誤判到第二組的條件概率為:P(2|1)=0.33</p><p>  將第二組誤判到第一組的條件概率為:P(1|2)=0.11</p><p><b>  二、貝葉斯判別法</b></p><p><b>  最大后驗概率法</b></p><

32、;p>  假設兩組的均服從多元正態(tài)分布,依據(jù)上表的信息,我們給出先驗概率有了先驗概率,我們接下來要利用SAS算出后驗概率,詳細代碼見附錄程序③。</p><p>  (廣東)判為第一組G1,(西藏)判為第一組G1。</p><p>  從上表可以看出當先驗概率為將第一組誤判到第二組的條件概率為:P(2|1)=0,將第二組誤判到第一組的條件概率為:P(1|2)=0.</p>

33、<p><b>  三、費希爾判別</b></p><p>  做費希爾判別需要假定兩組的的協(xié)方差矩陣相同,即Σ1=Σ2=Σ。</p><p><b>  本題中。經(jīng)計算</b></p><p><b>  組間矩陣:</b></p><p>  組內(nèi)矩陣,然后算

34、出,</p><p>  由下表可知,的特征值的個數(shù)為1,</p><p>  由下表可知,相應的標準化特征向量為 </p><p>  所以中心化的費希爾判別函數(shù)為:</p><p><b>  判別函數(shù)的組均值為</b></p><p>  將、代入判別函數(shù)得出、,從而求出臨街值。</

35、p><p><b>  代入判別函數(shù)得:</b></p><p><b>  ,.</b></p><p>  所以把(廣東)判為第一組G1,(西藏)判為第一組G1。</p><p>  總結:距離判別法,貝葉斯判別法,費希爾判別法都把廣東和西藏判為第一組,所以廣東和西藏應該屬于第一組。</p&g

36、t;<p><b>  附錄</b></p><p>  程序①: proc corr data=work.A cov;</p><p><b>  run;</b></p><p>  proc corr data=work.B cov;</p><p><b>  ru

37、n;</b></p><p>  程序②:proc discrim data=work.AB listerr crosslisterr;</p><p><b>  class g;</b></p><p>  var x1-x9;</p><p><b>  run;</b></

38、p><p>  程序③:proc discrim data=work.AB testdata=work.C testlist;</p><p><b>  class g;</b></p><p>  priors '1'=0.5 '2'=0.5;</p><p>  var x1-x9;&l

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論