版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、<p> 2012高教社杯全國大學(xué)生數(shù)學(xué)建模競賽</p><p><b> 承 諾 書</b></p><p> 我們仔細(xì)閱讀了中國大學(xué)生數(shù)學(xué)建模競賽的競賽規(guī)則。</p><p> 我們完全明白,在競賽開始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問題。&
2、lt;/p><p> 我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。</p><p> 我們鄭重承諾,嚴(yán)格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴(yán)肅處理。</p><p> 我們授權(quán)全國大學(xué)生數(shù)學(xué)建模競賽組委
3、會,可將我們的論文以任何形式進(jìn)行公開展示(包括進(jìn)行網(wǎng)上公示,在書籍、期刊和其他媒體進(jìn)行正式或非正式發(fā)表等)。</p><p> 我們參賽選擇的題號是(從A/B/C/D中選擇一項(xiàng)填寫): A </p><p> 我們的參賽報(bào)名號為(如果賽區(qū)設(shè)置報(bào)名號的話): 3776 </p>&l
4、t;p> 所屬學(xué)校(請?zhí)顚懲暾娜?廣東商學(xué)院 </p><p> 參賽隊(duì)員 (打印并簽名) :1. </p><p> 2.
5、 </p><p> 3. </p><p> 指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名): </p><p> 日期: 2012 年 9 月 10
6、日</p><p> 賽區(qū)評閱編號(由賽區(qū)組委會評閱前進(jìn)行編號):</p><p> 2012高教社杯全國大學(xué)生數(shù)學(xué)建模競賽</p><p><b> 編 號 專 用 頁</b></p><p> 賽區(qū)評閱編號(由賽區(qū)組委會評閱前進(jìn)行編號):</p><p> 賽區(qū)評閱記錄(可供賽區(qū)評閱
7、時(shí)使用):</p><p> 全國統(tǒng)一編號(由賽區(qū)組委會送交全國前編號):</p><p> 全國評閱編號(由全國組委會評閱前進(jìn)行編號):</p><p> 釀酒葡萄與葡萄酒的評價(jià)</p><p><b> 摘要</b></p><p> 對葡萄酒和釀酒葡萄的指標(biāo)、質(zhì)量進(jìn)行評價(jià)對于發(fā)展葡
8、萄酒行業(yè)和消費(fèi)者都具有重要意義,本文就葡萄酒和釀酒葡萄的指標(biāo)、質(zhì)量進(jìn)行研究分析。</p><p> 對兩組評酒員對酒質(zhì)量的評價(jià)差異以及評價(jià)結(jié)果可信度進(jìn)行分析,選用t檢驗(yàn)和非參數(shù)檢驗(yàn)結(jié)合總-分-總的分析思路進(jìn)行分析,首先對兩組數(shù)據(jù)分別對紅、白葡萄酒進(jìn)行t檢驗(yàn),得到兩組總分均值評價(jià)均無顯著差異的結(jié)果,然后對每一個(gè)酒樣品的所得總分進(jìn)行t檢驗(yàn)和參數(shù)檢驗(yàn),發(fā)現(xiàn)紅葡萄酒樣品12、23號以及白葡萄酒樣品12、27的評價(jià)結(jié)果有
9、顯著差異。因此,兩組評酒員在所有酒的總體評價(jià)是沒有明顯差異的,個(gè)別酒樣品評價(jià)存在差異。最后對總體均值和方差穩(wěn)定性進(jìn)行分析,可知第二組的評價(jià)結(jié)果比較穩(wěn)定,具有較高的可靠性。</p><p> 考慮根據(jù)葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對葡萄進(jìn)行分級,首先選用系統(tǒng)聚類的最短距離法、最長距離法、ward法分別對釀酒葡萄進(jìn)行分類,根據(jù)組內(nèi)組間區(qū)別度對三者的結(jié)果進(jìn)行比較選取,進(jìn)一步考慮每一類別的葡萄酒質(zhì)量分?jǐn)?shù)均值大小,均值越大
10、則等級越高,比較結(jié)果可知ward法的分類較優(yōu),特等的有10個(gè),一等的有12個(gè),二等的就有1個(gè),三等的則有4個(gè)。</p><p> 研究葡萄酒和釀酒葡萄的理化指標(biāo)聯(lián)系,選用逐步回歸模型分別建立每一個(gè)葡萄酒的理化指標(biāo)和葡萄理化指標(biāo)之間的線性關(guān)系,在建立線性方程的同時(shí)逐步篩選出顯著性不強(qiáng)的自變量,最后得到的17條線性方程分別描述了紅、白葡萄酒指標(biāo)和葡萄指標(biāo)的函數(shù)關(guān)系。</p><p> 分析
11、葡萄酒和葡萄的理化指標(biāo)對葡萄酒質(zhì)量的影響,首先利用主成分分析法簡化理化指標(biāo)和芳香物質(zhì)指標(biāo),進(jìn)一步,利用多元線性回歸建立理化指標(biāo)和芳香物質(zhì)對葡萄酒的質(zhì)量的一個(gè)線性方程,從各指標(biāo)系數(shù)的大小分析各指標(biāo)在評價(jià)中所占的權(quán)重,可以得出:理化指標(biāo)對酒質(zhì)有重要影響,但芳香物質(zhì)的權(quán)重比較大,紅、白葡萄酒和葡萄的芳香物質(zhì)權(quán)重之和分別占33.3%和28.13%,因此,不能光憑理化指標(biāo)評價(jià)酒質(zhì),還需考慮芳香物質(zhì)的影響。</p><p>
12、 關(guān)鍵詞:t檢驗(yàn) 理化指標(biāo) 聚類分析 逐步回歸 主成分分析模型 多元線性回歸 </p><p><b> 問題重述</b></p><p><b> 背景資料與條件</b></p><p> 確定葡萄酒質(zhì)量時(shí)一般是通過聘請一批有資質(zhì)的評酒員進(jìn)行品評。每個(gè)評酒員在對葡萄酒進(jìn)行品嘗后對其分類指標(biāo)打分,然后求和得到其總
13、分,從而確定葡萄酒的質(zhì)量。釀酒葡萄的好壞與所釀葡萄酒的質(zhì)量有直接的關(guān)系,葡萄酒和釀酒葡萄檢測的理化指標(biāo)會在一定程度上反映葡萄酒和葡萄的質(zhì)量。</p><p><b> 需要解決的問題</b></p><p> 結(jié)合附件1給出了某一年份一些葡萄酒的評價(jià)結(jié)果,附件2和附件3分別給出了該年份這些葡萄酒的和釀酒葡萄的成分?jǐn)?shù)據(jù),建立數(shù)學(xué)模型討論下列問題:</p>
14、<p> 1. 分析附件1中兩組評酒員的評價(jià)結(jié)果有無顯著性差異,哪一組結(jié)果更可信?</p><p> 2. 根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對這些釀酒葡萄進(jìn)行分級。</p><p> 3. 分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系。</p><p> 4.分析釀酒葡萄和葡萄酒的理化指標(biāo)對葡萄酒質(zhì)量的影響,并論證能否用葡萄和葡萄酒的理化指標(biāo)來
15、評價(jià)葡萄酒的質(zhì)量?</p><p><b> 問題分析</b></p><p> 對于問題一,分析兩組評酒員的評價(jià)結(jié)果有無顯著性差異,把各單項(xiàng)所得分?jǐn)?shù)之和作為單個(gè)評價(jià)人員對葡萄酒的質(zhì)量評價(jià)。采用總-分-總的模型結(jié)構(gòu)對兩組人員的評分差異進(jìn)行分析??紤]到本文所涉及的分析對象屬于小樣本,而小樣本的正態(tài)性檢驗(yàn)尤為重要,故先在總體上把兩組紅酒樣本的評分均值選用t檢驗(yàn)或者非參
16、數(shù)檢驗(yàn)進(jìn)行差異性分析,再進(jìn)一步對紅、白葡萄酒的每種酒樣品分別選用t檢驗(yàn)或非參數(shù)檢驗(yàn)進(jìn)行差異性分析,得出每種酒的兩組評分差異分析結(jié)果,最后對兩組評價(jià)結(jié)果在紅、白葡萄酒的變異系數(shù)與方差穩(wěn)定性關(guān)系進(jìn)行分析,從而判定哪一組的結(jié)果是可信的。</p><p> 對于問題二,根據(jù)釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對這些釀酒葡萄進(jìn)行分級。考慮到系統(tǒng)聚類分析就是將性質(zhì)比較相近的兩類合并為一類,并不斷合并最終得到幾個(gè)比較合理的類別。
17、故本文先根據(jù)葡萄的理化指標(biāo)選用聚類分析把葡萄進(jìn)行分類,把多個(gè)按照不同分類原則(不同的距離計(jì)算的聚類方法以及度量標(biāo)準(zhǔn))分類所得的結(jié)果進(jìn)行比較,選取最切合實(shí)際情況的分類情況,再結(jié)合葡萄酒的質(zhì)量對已分類的類別進(jìn)行等級評定。</p><p> 對于問題三,分析酒和葡萄的理化指標(biāo)的聯(lián)系,首先考慮的是能否建立精確的線性關(guān)系,而逐步回歸模型既能建立多變量的線性關(guān)系也能在建立過程不斷對自變量進(jìn)行檢驗(yàn)篩選,故選擇逐步線性回歸模型
18、分別對每一個(gè)葡萄酒的理化指標(biāo)和所有的葡萄理化指標(biāo)進(jìn)行回歸分析,建立線性關(guān)系,在建立的同時(shí)對顯著性不大的葡萄指標(biāo)進(jìn)行淘汰。以上分析均對紅葡萄酒和白葡萄酒分別進(jìn)行。</p><p><b> 基本假設(shè)</b></p><p> 1)假設(shè)問題一的評價(jià)分?jǐn)?shù)只受評價(jià)人員和酒的差異影響;</p><p><b> 2)假定;</b&g
19、t;</p><p> 3)評酒員在對葡萄酒進(jìn)行品嘗后對其分類指標(biāo)打分并求和,所得的總分可視為葡萄酒的質(zhì)量。</p><p><b> 符號說明</b></p><p> ?。旱陬惼咸丫频诮M評酒員打分的組數(shù)</p><p> :第類葡萄酒第組評酒員打分總評的標(biāo)準(zhǔn)差</p><p> ?。旱陬?/p>
20、葡萄酒第組評酒員打分總評的均值</p><p> ?。海旱陬惼咸丫频诮M評酒員打分總評的樣本方差</p><p> :兩樣本均值差的抽樣分布方差</p><p> :第類葡萄酒第組評酒員打分的變異系數(shù)</p><p><b> ?。鹤疃袒蜃铋L距離</b></p><p><b> :
21、回歸平方和</b></p><p> :加入第個(gè)變量的平方和</p><p><b> ?。簹埐?lt;/b></p><p><b> :總樣本數(shù)</b></p><p><b> ?。含F(xiàn)有自變量數(shù)</b></p><p><b>
22、 模型的建立與求解</b></p><p><b> 5.1問題一</b></p><p> 先對紅、白葡萄酒分別進(jìn)行總的差異性分析(把各個(gè)酒樣本的平均分作為個(gè)體),再局部到每一個(gè)酒樣品的兩組評價(jià)結(jié)果差異分析,最后再結(jié)合總體綜合均值和方差穩(wěn)定性來確定評分比較可靠的一組。根據(jù)這樣的總-分-總形式構(gòu)造以下兩個(gè)模型對問題一求解。</p>&l
23、t;p> 5.1.1 模型一:基于t檢驗(yàn)和非參數(shù)檢驗(yàn)的評分差異分析模型</p><p> ?。ㄒ唬┠P徒⒓扒蠼?lt;/p><p> 模型思想[1]:本文將每類葡萄酒兩組評分分成兩個(gè)總體,通過t檢驗(yàn)對兩個(gè)樣本總體數(shù)據(jù)進(jìn)行差異顯著性分析,前提必須滿足三個(gè)條件:①兩個(gè)樣本要滿足正態(tài)分布;②兩個(gè)樣本的方差齊性;③兩個(gè)樣本要相互獨(dú)立,即從一總體中抽取一批樣本對從另一總體中抽取一批樣本沒有任
24、何影響。從而提出原假設(shè),構(gòu)建一個(gè)t分布求得拒絕域,根據(jù)拒絕域判定原假設(shè)是否成立,得出兩組評分有無顯著性差異。</p><p><b> 1.正態(tài)性檢驗(yàn)</b></p><p> 正態(tài)性檢驗(yàn):根據(jù)表1,并且,選用建立在次序統(tǒng)計(jì)量基礎(chǔ)上的夏皮洛-威爾克檢驗(yàn)方法進(jìn)行檢驗(yàn),可以選用spss軟件計(jì)算出統(tǒng)計(jì)量W的值,最后根據(jù)求得的概率值與進(jìn)行比較,如果比大則符合正態(tài)性分布,否
25、則拒絕原假設(shè)。</p><p> 表1 正態(tài)性分布檢驗(yàn)的方法比較</p><p><b> 2.方差齊次性檢驗(yàn)</b></p><p> 提出原假設(shè):兩總體方差相等即,并選擇Levene檢驗(yàn)方法,根據(jù)最終求得的P值與進(jìn)行比較,若P>0.05,則滿足方差齊次性,否則不滿足方差其次性。在不滿足方差其次性的情況下則舍棄①式選擇④式。<
26、;/p><p> 3. 兩獨(dú)立樣本t檢驗(yàn)</p><p><b> ?。?)提出零假設(shè)</b></p><p> 兩獨(dú)立樣本T檢驗(yàn)的原假設(shè)為:兩總體均值無顯著差異。表述為:</p><p> 分別為第類葡萄酒中第一組和第二組酒總評分的均值。(記第1類葡萄酒為紅葡萄酒,第2類為白葡萄酒)</p><p
27、> ?。?)選擇檢驗(yàn)統(tǒng)計(jì)量</p><p> 對兩總體均值差的推斷是建立在來自兩個(gè)總體樣本均值差的基礎(chǔ)之上的,也就是希望利用兩組樣本均值的差去估計(jì)量總體均值的差。因此,應(yīng)關(guān)注兩樣本均值的抽樣分布。當(dāng)兩總體分布分別為和時(shí),兩樣本均值差的抽樣分布仍為正態(tài)分布,該正態(tài)分布的均值為,方差為。在不同的情況下,有不同的計(jì)算方式。</p><p> 第一種情況:當(dāng)兩總體方差未知且相等,即時(shí),采
28、用合并的方差作為兩個(gè)總體方差的估計(jì),數(shù)學(xué)定義為</p><p><b> ?、?lt;/b></p><p> 式中,,分別為第類葡萄酒中第一組和第二組酒樣本的方差;,分別為第類葡萄酒中第一組和第二組樣本的樣本數(shù)。此時(shí)兩樣本均值差的抽樣分布的方差為</p><p><b> ?、?lt;/b></p><p>
29、; 第二種情況:當(dāng)兩總體方差未知且不相等,即時(shí),分別采用各自的方差,此時(shí)兩樣本均值差的抽樣分布的方差為:</p><p> ?、?</p><p> 于是,兩總體均值差檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量為統(tǒng)計(jì)量,數(shù)學(xué)定義為:</p><p><b> ?、?lt;/b></p><p&
30、gt; 在第一種情況下,統(tǒng)計(jì)量服從個(gè)自由度的分布;在第二種情況下,服從修正自由度的分布,修正的自由度定義為</p><p><b> ?、?lt;/b></p><p> 由于各分類指標(biāo)進(jìn)行加總求均值之后消除了每種酒樣品之間以及每種酒樣品中每位評酒員評價(jià)總分之間的個(gè)體差異性可能導(dǎo)致兩組不存在顯著性差異。</p><p><b> 表3
31、 獨(dú)立樣本檢驗(yàn)</b></p><p> 應(yīng)用模型一將每類葡萄酒的每個(gè)評價(jià)員的兩組評分分成兩個(gè)總體,通過t檢驗(yàn)對兩個(gè)樣本總體數(shù)據(jù)進(jìn)行差異顯著性分析,前提仍必須滿足三個(gè)條件。 </p><p> 下邊以紅葡萄酒樣品1為例進(jìn)行t檢驗(yàn)</p><p><b> 1.T檢驗(yàn)的圖片:</b></p><p>
32、對紅葡萄酒樣品1的第一組評價(jià)質(zhì)量分?jǐn)?shù)進(jìn)行K-S正態(tài)性檢驗(yàn)結(jié)果如表1-3.</p><p> 從表1可知,在紅葡萄酒1的第一組人員的評價(jià)中可以看到,在10個(gè)評價(jià)結(jié)果當(dāng)中沒有一個(gè)人的評價(jià)結(jié)果缺失率是0%,即沒有人的評價(jià)結(jié)果是被排除的,就是說十個(gè)人的評價(jià)結(jié)果都是有效的。</p><p> 如果某分布的偏度和峰度均為0時(shí),則該分布呈正態(tài),若偏度>0時(shí),分布呈正偏態(tài),偏度<0時(shí),分布
33、呈負(fù)偏態(tài),時(shí),峰度>0曲線比較陡峭,峰度<0時(shí)曲線比較平坦。從表2可以看出,統(tǒng)計(jì)量的偏度>0,峰度<0,則說明分布是正偏態(tài),較平坦。</p><p><b> 表5 正態(tài)性檢驗(yàn)</b></p><p> 從上表可以看出,用S-W檢驗(yàn)方法進(jìn)行檢驗(yàn)的結(jié)果是sig的值0.636>0.05,所以可以說明該分布服從正態(tài)分布。</p>
34、<p> 通過正態(tài)性檢驗(yàn)可以得到除表6不符正態(tài)性的樣本外其他樣本都符合正態(tài)性檢驗(yàn)</p><p> 對表 不符正態(tài)性的樣本進(jìn)行對數(shù)轉(zhuǎn)換,設(shè)為不符正態(tài)性的每種酒樣本每個(gè)評酒員的打分總評,對其進(jìn)行對數(shù)轉(zhuǎn)換,即將轉(zhuǎn)換為后,對再一次進(jìn)行正態(tài)性檢驗(yàn)及t檢驗(yàn),正態(tài)性檢驗(yàn)結(jié)果見表7 </p><p> 由表可知白2、白3、白9、白12、白21、白25的P值小于0.05,仍然不具有正態(tài)
35、性則用非參數(shù)秩和檢驗(yàn)判定顯著性差異,見圖1;通過判定可用t檢驗(yàn)之后要進(jìn)行方差齊次性檢驗(yàn),從而確定兩組之間有無顯著性差異。詳細(xì)流程見圖2。</p><p> 圖1 非參數(shù)秩和檢驗(yàn)判定</p><p> 圖2 T檢驗(yàn)詳細(xì)流程</p><p> 5.1.2模型二:基于均值和方差的評價(jià)結(jié)果可靠性分析模型</p><p><b> ?。?/p>
36、一)模型建立</b></p><p> 先對紅葡萄酒中所有酒樣品的10個(gè)評酒員總評求得第一組均值、標(biāo)準(zhǔn)差分別為、及第二組均值、標(biāo)準(zhǔn)差分別為、,這里引入變異系數(shù)即標(biāo)準(zhǔn)差與均值的比值(見式子),反映單位均值上的離散程度,即可通過比較紅葡萄酒兩組評酒員總評的變異系數(shù),根據(jù)變異系數(shù)越小,則該組越穩(wěn)定,進(jìn)而表明其可信度越高原則,判定這兩組的可信度;同理可解得白葡萄酒第一二組均值、標(biāo)準(zhǔn)差以及各組的變異系數(shù)并判斷
37、白葡萄酒兩組中哪一組更可信。</p><p><b> ⑥</b></p><p><b> ?。ǘ┠P颓蠼?lt;/b></p><p> 通過Excel軟件處理數(shù)據(jù),得紅白葡萄酒各種酒樣品的均值、標(biāo)準(zhǔn)差以及變異系數(shù)【附錄3】,進(jìn)而解得紅白葡萄酒的變異系數(shù),見表 ,從表中可以知道且,即不管是紅葡萄酒還是白葡萄酒,第一組的
38、變異系數(shù)明顯大于第二組的,也就是說第二組明顯比較穩(wěn)定,可信度比較高。</p><p> 表8 紅白葡萄酒的變異系數(shù)</p><p><b> 5.3問題三</b></p><p> 5.3.1 基于逐步回歸對指標(biāo)間聯(lián)系進(jìn)行分析的模型</p><p> 模型思想:白葡萄酒和紅葡萄酒的分析方法是一樣的,所以以下建立的
39、模型只是針對紅葡萄酒而言的,白葡萄酒可以用一樣的方法代進(jìn)相應(yīng)的數(shù)據(jù)進(jìn)行分析。把附件2的數(shù)據(jù)分成兩部分,一部分用來做逐步線性回歸,一部分用于對求得的線性方程進(jìn)行檢驗(yàn)。用逐步回歸模型建立起酒的理化指標(biāo)和葡萄的理化指標(biāo)線性關(guān)系,利用附件2的指標(biāo)數(shù)據(jù),選用逐步法進(jìn)行如下循環(huán):引進(jìn)對因變量(酒的理化指標(biāo))影響最大的自變量(葡萄的理化指標(biāo)),對變量進(jìn)行檢驗(yàn),最小的則被移除。進(jìn)行這個(gè)循環(huán)直至不能引入和移除變量為止。根據(jù)逐步回歸建立起來的方程用附件2的
40、數(shù)據(jù)進(jìn)行檢驗(yàn),確定模型的可用性。</p><p> 引入第k個(gè)葡萄酒的理化指標(biāo)作為因變量,進(jìn)而進(jìn)入自變量,其中對第k個(gè)因變量當(dāng)引入第j個(gè)自變量時(shí),需要進(jìn)行選擇決策,選擇依據(jù)為:</p><p><b> k=1,2,…8</b></p><p> 對尚未入選成為自變量的變量計(jì)算,若滿足>,則改變量可以進(jìn)入線性方程的計(jì)算,成為自變量。
41、</p><p> 在一個(gè)自變量入選后對線性方程里原有的自變量進(jìn)行淘汰決策,選擇依據(jù)和入選的過程相反,但檢驗(yàn)過程一樣。即選擇依據(jù)為:</p><p><b> k=1,2,…8</b></p><p> 對在第j個(gè)自變量入選之前的自變量計(jì)算,若當(dāng)中的其中一個(gè)自變量滿足>,則淘汰,此變量不再具有自變量(對于改因變量而言)的資格。<
42、;/p><p> 在對自變量進(jìn)行篩選后進(jìn)行線性回歸分析,選用最小二乘法進(jìn)行系數(shù)求解。求解出具有以下形式的8個(gè)紅葡萄酒理化指標(biāo)與葡萄理化指標(biāo)線性方程:</p><p> k=1,2,…8⑦</p><p> 對⑦式,如果在循環(huán)過程中被淘汰,則對應(yīng)的系數(shù)為0。</p><p> 5.3.2 模型的求解</p><p
43、> 先對數(shù)據(jù)進(jìn)行預(yù)處理,把測試多次的數(shù)據(jù)進(jìn)行均值處理,因?yàn)橐患壷笜?biāo)就把二級指標(biāo)的特性概括了,所以二級指標(biāo)不給予考慮,只考慮紅葡萄酒和葡萄的一級指標(biāo)的關(guān)系。對數(shù)據(jù)進(jìn)行預(yù)處理后各符號代表的意義如表9和表10:其中x(i)表示,y(i)表示</p><p> 表9 預(yù)處理后的葡萄的指標(biāo)</p><p> 表10 預(yù)處理后的紅葡萄酒的指標(biāo)</p><p> 根
44、據(jù)逐步回歸的原理,利用表9和表10的數(shù)據(jù)用matlab選用逐步回歸的求解函數(shù)Stepwise(x,y,n,a)函數(shù)對逐步回歸模型的線性方程進(jìn)行求解,其中取置信水平為a=0.05,求解詳細(xì)程序見【附錄3】。</p><p> 初步求解的紅酒花色苷指標(biāo)對應(yīng)葡萄的花色苷、蘋果酸、國花質(zhì)量指標(biāo)的關(guān)系結(jié)果如下:</p><p><b> ?。?)</b></p>
45、<p> 對于(2)式,在求解的過程中的F值是遞增的,即說明在逐步回歸過程中是逐步優(yōu)化的,而不會出現(xiàn)因?yàn)橐肓诵伦兞炕蚴翘蕹兞繉?dǎo)致線性方程和實(shí)際有很大的出入。</p><p> 由于Stepwise函數(shù)并不給出常數(shù)項(xiàng),可以通過數(shù)據(jù)估計(jì)求解。求解公式為:</p><p> 很據(jù)上述求解公式用excel進(jìn)行數(shù)值統(tǒng)計(jì)求解,把求解所得的常量代回方程得最終紅葡萄酒指標(biāo)和葡萄指標(biāo)線
46、性關(guān)系見表11:</p><p> 表11 紅葡萄酒指標(biāo)和葡萄指標(biāo)線性關(guān)系表</p><p> 結(jié)果分析:紅葡萄酒的指標(biāo)和葡萄指標(biāo)之間的各個(gè)線性方程可以看出,葡萄指標(biāo)并不是所有指標(biāo)都是對紅葡萄酒的指標(biāo)起作用的,所以建立起來的線性方程主要反映出葡萄理化指標(biāo)里對葡萄酒理化指標(biāo)影響比較顯著的關(guān)系,關(guān)系不顯著的指標(biāo),一部分被隱含在顯著性強(qiáng)的指標(biāo)里,一部分對葡萄酒指標(biāo)幾乎沒影響的就被剔除了。&l
47、t;/p><p> 對白葡萄酒和白葡萄的分析過程是類似的,分析結(jié)果見【附錄4】</p><p><b> 5.3問題三</b></p><p> 5.3.1基于聚類分析的葡萄等級劃分模型</p><p> 模型思想:結(jié)合題目附件2的葡萄理化指標(biāo)數(shù)據(jù),先選用不同分類原則的聚類分析對葡萄進(jìn)行分類,其中分類原則考慮了聚類的
48、方法和度量標(biāo)準(zhǔn)兩個(gè)的影響而選取了6個(gè)分類原則的組合進(jìn)行求解,把分類結(jié)果和實(shí)際情況進(jìn)行按照定義的標(biāo)準(zhǔn)進(jìn)行對比,得出一個(gè)比較符合實(shí)際情況的分類,再結(jié)合問題一的求解結(jié)果,把各個(gè)類別的葡萄品種對應(yīng)的葡萄質(zhì)量均值進(jìn)行對比,根據(jù)數(shù)值大小進(jìn)行等級劃分。</p><p> 聚類分析對葡萄進(jìn)行分類</p><p> 先對相似度量的方法(距離的類型)以及度量的標(biāo)準(zhǔn)進(jìn)行選擇。如果只是選用一個(gè)距離和度量的標(biāo)準(zhǔn)
49、,則難以進(jìn)行結(jié)果比較檢驗(yàn)。本文選用了最常用的操作簡單的最短距離法,最長距離法,以及分類效果比較好的ward法(離差平方和法)對葡萄進(jìn)行分類,并根據(jù)三個(gè)聚類分析法的求解結(jié)果進(jìn)行比較,最后選取一個(gè)比較合理的分類方案。而聚類分析的度量準(zhǔn)則則選取比較有代表性和權(quán)威性的Euclidean距離和平方Euclidean距離。</p><p> 最短距離法聚類步驟如下:</p><p> 1,規(guī)定紅葡
50、萄酒的27個(gè)樣本間的距離,計(jì)算樣本兩兩之間的距離,得到對稱矩開始每個(gè)葡萄酒樣品自成一類。</p><p> 2,選擇對稱矩陣中的最小非零元素。將兩個(gè)樣品之間最小距離記為:</p><p><b> 其中p≠i≠j</b></p><p> 3,將這兩個(gè)樣品歸并成為一類,記為,計(jì)算與其他樣品距離。重復(fù)以上過程直到所有樣品合并為一類。<
51、/p><p> 最長距離法聚類分析和ward法聚類分析和最短距離法聚類分析的過程相差無幾,只是對應(yīng)的距離有所改變:</p><p> 最長距離法: 其中p≠i≠j</p><p> Ward距離相對最短距離和最長距離的計(jì)算會比較復(fù)雜:</p><p><b> 如果,則距離改為:</b></p>&
52、lt;p> 求得葡萄的各個(gè)分類方案之后,結(jié)果之間進(jìn)行比較,因?yàn)榻M內(nèi)距離小,組間距離大這樣的特征就是好的分類所必須有的。所以定義一個(gè)指標(biāo),作為方案選擇的評價(jià)指標(biāo):</p><p> 組內(nèi)組間區(qū)別度=組內(nèi)最小距離/組間最大距離</p><p> 距離指標(biāo)越大則說明分類效果越好,反之則說明分類不是很好。</p><p> 通過題目附件1的數(shù)據(jù)和問題一的結(jié)論求
53、解出比較具有可信度的紅、白葡萄酒質(zhì)量(以分?jǐn)?shù)衡量)。按照葡萄的分類,分別把每個(gè)類別的葡萄樣品所對應(yīng)的葡萄酒樣品的分?jǐn)?shù)求均值,并以此作為分級的指標(biāo),均值越大者的級別越高。</p><p> 5.3.2 模型的求解</p><p> 對附件1數(shù)據(jù)結(jié)合問題一的結(jié)論對葡萄酒質(zhì)量進(jìn)行預(yù)處理,預(yù)處理結(jié)果如表1。</p><p><b> 表12 質(zhì)量分析<
54、;/b></p><p> 用聚類分析原理對葡萄分類,可以用SPSS軟件結(jié)合聚類分析的原理按照以下操作求解:導(dǎo)入數(shù)據(jù)——>分析——>分類——>系統(tǒng)聚類——>方法——>區(qū)間分別選擇平方Euclidean距離和Euclidean進(jìn)行操作,比較結(jié)果。用SPSS求解出來的所有結(jié)果圖2。</p><p><b> 圖3 聚類樹狀圖</b>
55、</p><p> 針對這三個(gè)聚類分析方法和度量標(biāo)準(zhǔn)的組合形成的五個(gè)結(jié)果進(jìn)行比較,比較結(jié)果如表13,從表1可知,因?yàn)閣ard平方Euclidean距離方法的組內(nèi)組間區(qū)別度明顯比其他五個(gè)結(jié)果的要少,則說明ward平方Euclidean距離方法做出來的結(jié)果組內(nèi)距離比較少,組間距離比較大,所以最終選擇ward平方Euclidean距離方法的結(jié)果。</p><p> 根據(jù)ward平方Eucli
56、dean距離方法所得的結(jié)果進(jìn)行等級劃分,結(jié)果如表2,從表2可知,紅葡萄的等級劃分結(jié)果中,三等的只有4號葡萄樣品,而特等的則有1,2,3等共計(jì)10個(gè)樣品,一等則有12個(gè)樣品,二等則有4個(gè)樣品,從這些信息可以反映出大多數(shù)的釀酒葡萄的等級是比較高的,和第一問的葡萄酒的質(zhì)量評定結(jié)果相吻合。</p><p><b> 5.4問題四</b></p><p> 5.4.1主成分
57、分析模型</p><p> 模型思想:主成分分析(principal components analysis, PCA)是一種簡化數(shù)據(jù)集的技術(shù),也被稱為主分量分析,是揭示大樣本、多變量數(shù)據(jù)或樣本之間內(nèi)在關(guān)系的一種方法,本文就是利用主成分分析降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),降低觀測空間的維數(shù),以獲取最主要的信息。</p><p> 主成分分析法代數(shù)模型[4]</p>
58、;<p> 假設(shè)用p個(gè)變量來描述研究對象,分別用X1,X2…Xp來表示,這p個(gè)變量構(gòu)成的p維隨機(jī)向量為X=(X1,X2…Xp)t。設(shè)隨機(jī)向量X的均值為μ,協(xié)方差矩陣為Σ。對X進(jìn)行線性變化,考慮原始變量的線性組合:</p><p> Z1=μ11X1+μ12X2+…μ1pXp</p><p> Z2=μ21X1+μ22X2+…μ2pXp</p><p&
59、gt;<b> …… …… ……</b></p><p> Zp=μp1X1+μp2X2+…μppXp</p><p> 主成分是不相關(guān)的線性組合Z1,Z2……Zp,并且Z1是X1,X2…Xp的線性組合中方差最大者,Z2是與Z1不相關(guān)的線性組合中方差最大者,…,Zp是與Z1,Z2 ……Zp-1都不相關(guān)的線性組合中方差最大者。</p><p&g
60、t;<b> 模型的求解:</b></p><p> 在SPSS19.0軟件中可以方便地實(shí)現(xiàn)主成分分析的方法。具體操作如下:</p><p> 以紅葡萄的理化指標(biāo)為展示,可以得到如表一的成份矩陣:</p><p> 表13 紅葡萄理化指標(biāo)的成份矩陣</p><p> 5.4.2多元線性回歸模型</p>
61、;<p> 模型思想:考慮葡萄酒質(zhì)量的影響因素中,葡萄酒的質(zhì)量不止受到一個(gè)變量的影響。例如,葡萄酒和釀酒葡萄的理化指標(biāo)、葡萄酒和釀酒葡萄的感官指標(biāo)等都會影響葡萄酒的質(zhì)量。用多元線性回歸模型恰能體現(xiàn)出各指標(biāo)與葡萄酒質(zhì)量的關(guān)系。</p><p><b> 模型的建立:</b></p><p> 按照題意,設(shè)置4個(gè)自變量:、、、分別代表標(biāo)準(zhǔn)化后的(紅/白
62、)各酒樣本對應(yīng)釀酒葡萄理化指標(biāo)的主成分均值、標(biāo)準(zhǔn)化后的(紅/白)各酒樣本對應(yīng)葡萄酒理化指標(biāo)的主成分均值、標(biāo)準(zhǔn)化后的(紅/白)各酒樣本對應(yīng)釀酒葡萄芳香物質(zhì)的主成分均值、標(biāo)準(zhǔn)化后的(紅/白)各酒樣本對應(yīng)葡萄酒芳香物質(zhì)的主成分均值。因變量為Y,含義是對問題一求解出的(紅/白)各酒樣本的可靠性分?jǐn)?shù)進(jìn)行標(biāo)準(zhǔn)化后的向量。、、、分別是、、、的系數(shù)。常數(shù)項(xiàng)設(shè)為B。數(shù)學(xué)表達(dá)式為:</p><p> Y=*+*+*+*+B<
63、/p><p><b> 模型二的求解:</b></p><p> 首先,要求出模型中的、、、向量。同樣以紅葡萄理化指標(biāo)為例,不妨設(shè)表13中的數(shù)據(jù)為矩陣A,A反應(yīng)了各主成分與指標(biāo)(氨基酸總量、蛋白質(zhì)、VC含量……)之間的關(guān)系;數(shù)據(jù)處理后的矩陣設(shè)為B,則B反應(yīng)了指標(biāo)與各種酒樣本的關(guān)系。因此B*A的轉(zhuǎn)換體現(xiàn)出各主成分與各酒樣品的關(guān)系。對B*A矩陣的酒樣品求主成分均值,再對所
64、得列向量進(jìn)行標(biāo)準(zhǔn)化,即可得到紅葡萄理化指標(biāo)的向量。</p><p> 同理,(紅/白)葡萄的向量、、、皆可求出。具體計(jì)算結(jié)果可參照表3:</p><p> 表14:多元線性回歸模型求得的樣本值表</p><p> 運(yùn)用matlab軟件中的regress函數(shù)求解出多元線性回歸模型的表達(dá)式。代碼為:</p><p> B = regres
65、s(Y,[ones(size(Y)),X1,X2,X3,X4])</p><p><b> 所求系數(shù)為:</b></p><p> 為了更好地對各系數(shù)進(jìn)行比較和分析,對所求的系數(shù)取絕對值后再歸一化,得到表3:</p><p> 表3:絕對值、歸一化處理后系數(shù)值表</p><p> 從表3可以看出,由于、、、、Y都
66、是經(jīng)過標(biāo)準(zhǔn)化處理的,他們之間的關(guān)系屬于無量綱化。因此,Y的值和系數(shù)K關(guān)系很大。X的值稍微變化,K值越大,Y的變化就會越大??傻?,系數(shù)K的值可以反映出、、、對Y的影響。經(jīng)過分析可以得出以下結(jié)論:</p><p> ?。?)由于歸一化后各所占的比例都落入到[0.2,0.4]區(qū)間范圍內(nèi),差異不大,所以釀酒葡萄的理化指標(biāo)、葡萄酒的理化指標(biāo)、釀酒葡萄的芳香物質(zhì)(感官指標(biāo))、葡萄酒的芳香物質(zhì)(感官指標(biāo))對葡萄酒的質(zhì)量影響相當(dāng)
67、。</p><p> ?。?)由于釀紅酒葡萄的理化指標(biāo)比例+紅葡萄酒的理化指標(biāo)比例=71.87%,釀白酒葡萄的理化指標(biāo)比例+白葡萄酒的理化指標(biāo)比例=60.67%.這反應(yīng)了葡萄酒和釀酒葡萄的理化指標(biāo)對葡萄酒的質(zhì)量起著主要的影響。但是,不能僅僅依靠葡萄酒和釀酒葡萄的理化指標(biāo)來評價(jià)葡萄酒的質(zhì)量,這樣會產(chǎn)生比較大的誤差。如需更準(zhǔn)確地判別葡萄酒的質(zhì)量,還需要把芳香物質(zhì)考慮進(jìn)去。</p><p>
68、(3)由于對于白葡萄酒和紅葡萄酒來說,常數(shù)項(xiàng)B都等于O,所以也驗(yàn)證了葡萄酒的質(zhì)量是由理化指標(biāo)和感官指標(biāo)決定的。</p><p><b> 模型的評價(jià)及優(yōu)化</b></p><p><b> 模型的優(yōu)點(diǎn)</b></p><p> 對于第一問的模型從總體到局部細(xì)致分析再從總體的均值和方差分析穩(wěn)定性,考慮的很周全。第二問的
69、聚類分析進(jìn)行多個(gè)方法對比得出的結(jié)果比較這一步做得很合理,第三問的逐步回歸建立起來的線性方程既考慮到自變量的顯著性,考慮得比較全面,第四問選用多元線性回歸模型求解出來的結(jié)果具有精確性,減少了主觀性帶來的誤差。</p><p><b> 模型的缺點(diǎn)</b></p><p> 第二問的僅僅用組內(nèi)組間區(qū)別度作為方法的判別,不夠周全。</p><p>
70、;<b> 參考文獻(xiàn):</b></p><p> [1]茆詩松,程依明.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2004.7; </p><p> [2] 湖北省大學(xué)學(xué)生教學(xué)建模競賽專家組織.數(shù)學(xué)建模[M].武漢:華中科技大學(xué)出版社,2006.2; </p><p> [3] 朱星宇,陳勇強(qiáng).SPSS多元統(tǒng)計(jì)分析方法及應(yīng)用[M
71、].北京:清華大學(xué)出版社,2011; </p><p> [4] 李桂成.計(jì)算方法[M].北京:電子工業(yè)出版社,2005.10;</p><p> [5] 陳杰等.MATLAB寶典[M](第3版).北京:電子工業(yè)出版社,2011;</p><p> [6] 姜啟源,謝金星,葉俊.數(shù)學(xué)建模[M].北京:高等教育出版社,2011.1;</p><
72、;p> [7] 母麗華,周永芳.數(shù)學(xué)建模[M].北京:科學(xué)出版社,2011。</p><p><b> 附件</b></p><p><b> 附錄1</b></p><p><b> 紅葡萄的變異系數(shù)</b></p><p><b> 白葡萄變異系數(shù)
73、</b></p><p><b> 附錄4</b></p><p> 白葡萄酒的理化指標(biāo)和白葡萄理化指標(biāo)之間的線性關(guān)系</p><p><b> 附錄5</b></p><p><b> 逐步回歸法程序:</b></p><p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 天山北麓釀酒葡萄產(chǎn)區(qū)葡萄與葡萄酒品質(zhì)研究.pdf
- 葡萄酒的評價(jià)建模論文
- 葡萄酒與葡萄酒文化論文-淺談葡萄酒的歷史,文化及現(xiàn)狀
- 葡萄酒論文
- 葡萄酒論文-葡萄酒的分析及等級劃分
- 葡萄酒的評價(jià)數(shù)學(xué)建模論文
- 葡萄酒的評價(jià)優(yōu)秀論文
- 葡萄酒的評價(jià)-數(shù)學(xué)建模論文
- 鮮食葡萄釀酒特性及葡萄酒品質(zhì)的研究.pdf
- 瑞引釀酒葡萄Granoir果實(shí)與葡萄酒品質(zhì)研究.pdf
- 葡萄酒的評價(jià)數(shù)學(xué)建模論文
- 論文—自制葡萄酒
- 白葡萄酒與白葡萄蒸餾酒
- 葡萄酒的評價(jià)—數(shù)學(xué)畢業(yè)論文
- 關(guān)于葡萄酒評價(jià)的數(shù)學(xué)建模論文
- 數(shù)學(xué)建模-葡萄酒評價(jià)
- 基于理化指標(biāo)分析的葡萄與葡萄酒的評價(jià)
- 基于理化指標(biāo)分析的葡萄與葡萄酒的評價(jià)
- 葡萄酒畢業(yè)論文
- 釀葡萄酒的葡萄品種
評論
0/150
提交評論