聲音心理學(xué)模型

上傳人：奔*** IP屬地：河北更新時間：2024-01-04 格式：ppt 頁數(shù)：30 大小：318.00KB 人氣指數(shù)：12 舉報 版權(quán)申訴

已閱讀1頁，還剩29頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、主要內(nèi)容,1.聽覺模型2.M-PEAG1心理聲學(xué)模型結(jié)構(gòu)3.仿真結(jié)果4.關(guān)于后期工作的想法5.總結(jié),1.聽覺模型,1.1 人耳聽覺模型(HAS)1.2 人耳生理系統(tǒng)和臨界頻段1.3 安靜狀態(tài)閾值和掩蔽,1.聽覺模型,人耳對于頻率的感知呈對數(shù)規(guī)律的;會產(chǎn)生出差頻;人耳生理系統(tǒng)和臨界頻段臨界頻段=24.7(4.37F+1)有調(diào)成分和無調(diào)成分當(dāng)音調(diào)間的頻率差大于臨界頻段時，就是一般的和音；而當(dāng)頻率差小于

2、臨界頻段時，就成為不諧和音Bark 感知頻率的單位，1 個臨界頻段的寬度為 1Bark。使用 Bark 來標(biāo)度，需要將物理頻率轉(zhuǎn)化為心理聲學(xué)頻率。這樣，一個純音就可以用心理掩蔽曲線來表示。,1.聽覺模型,安靜狀態(tài)閾值安靜狀態(tài)閾值曲線表示了在給定頻率上，人耳能夠聽到聲音的最小聲壓級。0dB 時的閾值為 1kHz。人耳在 1~5kHz 的范圍內(nèi)最為敏感，可以聽到低于 0dB 參考值幾個分貝的信號。一般而言，兩個相同能量不

3、同頻率的信號，聽起來是不一樣的。類似的，能夠聽到的噪聲和失真也隨頻率而改變。在太高或太低的頻率處，聽覺的靈敏度也會下降。,1.聽覺模型,掩蔽閾值掩蔽閾值是指幾乎聽不到聲音的聲壓級。當(dāng)同時有好幾個音調(diào)時，當(dāng)高音調(diào)完全掩蓋低音調(diào)時，就會出現(xiàn)掩蔽。掩蔽的一般性介紹掩蔽的分類:同時掩蔽; 異時掩蔽掩蔽的特點:利用聲調(diào)的強弱; 利用人腦的反應(yīng)延遲,2.M-PEAG1心理聲學(xué)模型結(jié)構(gòu),2.1 譜計算2.2 聲壓級測

4、定2.3 安靜狀態(tài)閾值2.4 判決有調(diào)和無調(diào)2.5 有調(diào)和無調(diào)成分的抽取2.6 單獨掩蔽閾值的計算2.7 總體掩蔽閾值的計算,2.1 譜計算,進行512點的FFT計算。FFT是直接對輸入PCM信號加海寧窗后進行的。海寧窗h(i)和功率譜X(k)的計算公式分別為：,2.2 聲壓級的測定,子帶n中的聲壓級的計算公式如下 :,2.3 安靜狀態(tài)閾值,安靜閾值也稱絕對閾值，它依賴于信號的抽樣頻率，由經(jīng)驗得出。對應(yīng)計算掩蔽閾值頻率范圍中的

5、每個樣點，根據(jù)總體比特率補償絕對閾值，對于比特率≥96kbit/s，補償值為12dB，對于比特率<96kbit/s，補償值為0dB。下圖1給出了樣本音頻信號的安靜狀態(tài)閾值。,2.3 安靜狀態(tài)閾值,2.4 判決有調(diào)和無調(diào)成分,一個掩蔽成分的可調(diào)性影響到掩蔽閾值，因此必須判定有調(diào)與無調(diào)成分。為了計算總掩蔽閾值，必須從FFT頻譜中得出有調(diào)和無調(diào)成分。首先決定局部最大值，然后提取有調(diào)成分（正弦波），以及計算一個臨界頻段頻率范圍內(nèi)無調(diào)成分的

6、強度。下圖2給出了樣本音頻信號局部最大值的確定，圖中帶圈的成分為局部最大值成分。,2.4 判決有調(diào)和無調(diào)成分,2.4 判決有調(diào)和無調(diào)成分,而臨界頻段的頻寬隨著中心頻率變化，低頻時大約0.1kHz頻寬，高頻時大約4kHz頻寬。從心理聲學(xué)實驗可以知道，耳朵的低頻分辨率比高頻分辨率好。為了決定某個局部最大值是否可能是有調(diào)成分，還必須了解局部最大值所處頻率處臨界頻段的頻寬df。在不同的頻率段所用的頻寬是事先規(guī)定的： df =172.26

7、6Hz，0kHz < f ≤5.512kHz df =281.25Hz， 5.512kHz < f ≤11.024kHz df =562.50Hz， 11.024kHz < f ≤19.982kHz,2.4 判決有調(diào)和無調(diào)成分,綜上所述，要列出譜線X(k)是有調(diào)或是無調(diào)，需執(zhí)行以下三個運算: 標(biāo)明局部最大值。列出有調(diào)成分并計算聲壓級.列出無調(diào)成分并計算功率.下面的圖3和圖4依次顯示了有調(diào)和無調(diào)

8、成分的讀取。,2.4 判決有調(diào)和無調(diào)成分,2.4 判決有調(diào)和無調(diào)成分,2.5 有調(diào)和無調(diào)掩蔽成分的抽取,抽取是用來減少掩蔽成分?jǐn)?shù)目的步驟，它是計算綜合掩蔽閾值時必須考慮的問題。只要有調(diào)成分的X(k)之間滿足小于0.5Bark的寬度，就可以抽取這樣的有調(diào)成分。方法是列出有調(diào)成分，在臨界頻段范圍內(nèi)采用0.5Bark寬度的滑動窗，若窗內(nèi)存在兩個或更多的成分，僅保持窗內(nèi)最高功率的成分，移去所有較小功率的成分。圖5和圖6給出了樣本音頻信號有調(diào)成分

9、、無調(diào)成分和安靜狀態(tài)閾值的比較。,2.5 有調(diào)和無調(diào)掩蔽成分的抽取,2.5 有調(diào)和無調(diào)掩蔽成分的抽取,2.6 單獨掩蔽閾值的計算,通常在所有的N/2個頻率樣點的譜線中，僅僅只有其中一部分頻率樣點的譜線用于綜合掩蔽閾值計算。在最低頻的6個子帶的頻域范圍內(nèi)的譜線不考慮進行下采樣；接著6個子帶的頻域范圍內(nèi)的譜線，每隔1個譜線考慮進行下采樣；剩余的最高頻處的18個子帶的頻域范圍內(nèi)的譜線，每隔4個譜線考慮進行下采樣。將所有考慮進行下采樣的譜線進行

10、下采樣，下采樣的樣點數(shù)n=106。,2.6 單獨掩蔽閾值的計算,對于這108個樣點，經(jīng)驗給定對應(yīng)的譜值。對每個序號為k有調(diào)無調(diào)成分，選擇最接近其譜值X(k)的106樣點譜值中的某個樣點，將該成分序號令為i，i∈{1,2,3,...,106}。j為所有有調(diào)、無調(diào)成分在抽取后的譜線序號。有調(diào)和無調(diào)的單獨掩蔽閾值分別由下式計算：,,,2.6 單獨掩蔽閾值的計算,2.6 單獨掩蔽閾值的計算,2.7 總體掩蔽閾值的計算,第i個頻率樣點的總掩蔽閾值

11、LTg(i)是由序號為j的所有有調(diào)無調(diào)掩蔽成分的單獨掩蔽閾值LTtm[z(j),z(i)] 、LTnm[z(j),z(i)]和安靜狀態(tài)閾值LTq(i)求出的，把相應(yīng)于單獨掩蔽閾值的功率和安靜狀態(tài)閾值的功率相加可求得總掩蔽閾值：其中，有調(diào)掩蔽成分總數(shù)為m，無調(diào)掩蔽成分總數(shù)為n。圖9給出了樣本音頻信號的總體掩蔽閾值，即圖中黑色的虛線。,2.7 總體掩蔽閾值的計算,3.仿真結(jié)果,仿真文件選擇:1-5.wav仿真數(shù)據(jù)截取:總體掩蔽閾值,4.關(guān)

12、于后期工作的想法,基于心理聲學(xué)模型的音頻數(shù)據(jù)隱藏方案: 利用宿主音頻信號的心理學(xué)模型得到的掩蔽閾值，對偽隨機序列調(diào)制后的隱藏消息進行頻域掩蔽，將掩蔽后的偽隨機消息嵌入宿主音頻。利用偽隨機信號的相關(guān)性思路的結(jié)合,5.總結(jié),心理聲學(xué)模型的優(yōu)缺點采用以宿主音頻信號本身的頻域掩蔽效應(yīng)來調(diào)制隱藏的偽隨機序列，因此被隱藏的偽隨機序列是基于宿主音頻信號內(nèi)容的，嵌入后具有良好的聽覺不可感知性.但是在變換域中的抗攻擊能力較弱.,5.總

13、結(jié),信息隱藏技術(shù)的展望利用數(shù)字化媒體進行信息隱藏是一個嶄新的研究領(lǐng)域，在應(yīng)用需求的刺激下得到了迅速的發(fā)展，使其能夠橫跨數(shù)字信號處理、圖像處理、語音處理、模式識別、數(shù)字通信、多媒體技術(shù)、密碼學(xué)等多個學(xué)科，盡管在目前還沒形成完整的理論體系，但由于它是一項與具體應(yīng)用十分密切的實用技術(shù)，隨著數(shù)字化和網(wǎng)絡(luò)化的發(fā)展，其應(yīng)用價值會越發(fā)突出。信息隱藏系統(tǒng)的幾個基本特性之間存在著相互矛盾的一面，例如：隱藏數(shù)據(jù)量和隱藏信息免疫能力之間，不易察覺性

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

聲音心理學(xué)模型

文檔簡介

溫馨提示

最新文檔

評論

聲音心理學(xué)模型

文檔簡介

溫馨提示

最新文檔

評論

免費下載