聲音心理學模型_第1頁
已閱讀1頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、主要內容,1.聽覺模型2.M-PEAG1心理聲學模型結構3.仿真結果4.關于后期工作的想法5.總結,1.聽覺模型,1.1 人耳聽覺模型(HAS)1.2 人耳生理系統(tǒng)和臨界頻段1.3 安靜狀態(tài)閾值和掩蔽,1.聽覺模型,人耳對于頻率的感知 呈對數(shù)規(guī)律的;會產生出差頻;人耳生理系統(tǒng)和臨界頻段 臨界頻段=24.7(4.37F+1)有調成分和無調成分 當音調間的頻率差大于臨界頻段時,就是一般的和音;而當頻率差小于

2、臨界頻段時,就成為不諧和音Bark 感知頻率的單位,1 個臨界頻段的寬度為 1Bark。使用 Bark 來標度,需要將物理頻率轉化為心理聲學頻率。這樣,一個純音就可以用心理掩蔽曲線來表示。,1.聽覺模型,安靜狀態(tài)閾值 安靜狀態(tài)閾值曲線表示了在給定頻率上,人耳能夠聽到聲音的最小聲壓級。0dB 時的閾值為 1kHz。人耳在 1~5kHz 的范圍內最為敏感,可以聽到低于 0dB 參考值幾個分貝的信號。一般而言,兩個相同能量不

3、同頻率的信號,聽起來是不一樣的。類似的,能夠聽到的噪聲和失真也隨頻率而改變。在太高或太低的頻率處,聽覺的靈敏度也會下降。,1.聽覺模型,掩蔽閾值 掩蔽閾值是指幾乎聽不到聲音的聲壓級。當同時有好幾個音調時,當高音調完全掩蓋低音調時,就會出現(xiàn)掩蔽。掩蔽的一般性介紹 掩蔽的分類:同時掩蔽; 異時掩蔽 掩蔽的特點:利用聲調的強弱; 利用人腦的反應延遲,2.M-PEAG1心理聲學模型結構,2.1 譜計算2.2 聲壓級測

4、定2.3 安靜狀態(tài)閾值2.4 判決有調和無調2.5 有調和無調成分的抽取2.6 單獨掩蔽閾值的計算2.7 總體掩蔽閾值的計算,2.1 譜計算,進行512點的FFT計算。FFT是直接對輸入PCM信號加海寧窗后進行的。海寧窗h(i)和功率譜X(k)的計算公式分別為:,2.2 聲壓級的測定,子帶n中的聲壓級的計算公式如下 :,2.3 安靜狀態(tài)閾值,安靜閾值也稱絕對閾值,它依賴于信號的抽樣頻率,由經驗得出。對應計算掩蔽閾值頻率范圍中的

5、每個樣點,根據(jù)總體比特率補償絕對閾值,對于比特率≥96kbit/s,補償值為12dB,對于比特率<96kbit/s,補償值為0dB。下圖1給出了樣本音頻信號的安靜狀態(tài)閾值。,2.3 安靜狀態(tài)閾值,2.4 判決有調和無調成分,一個掩蔽成分的可調性影響到掩蔽閾值,因此必須判定有調與無調成分。為了計算總掩蔽閾值,必須從FFT頻譜中得出有調和無調成分。首先決定局部最大值,然后提取有調成分(正弦波),以及計算一個臨界頻段頻率范圍內無調成分的

6、強度。下圖2給出了樣本音頻信號局部最大值的確定,圖中帶圈的成分為局部最大值成分。,2.4 判決有調和無調成分,2.4 判決有調和無調成分,而臨界頻段的頻寬隨著中心頻率變化,低頻時大約0.1kHz頻寬,高頻時大約4kHz頻寬。從心理聲學實驗可以知道,耳朵的低頻分辨率比高頻分辨率好。為了決定某個局部最大值是否可能是有調成分,還必須了解局部最大值所處頻率處臨界頻段的頻寬df。在不同的頻率段所用的頻寬是事先規(guī)定的: df =172.26

7、6Hz,0kHz < f ≤5.512kHz df =281.25Hz, 5.512kHz < f ≤11.024kHz df =562.50Hz, 11.024kHz < f ≤19.982kHz,2.4 判決有調和無調成分,綜上所述,要列出譜線X(k)是有調或是無調,需執(zhí)行以下三個運算: 標明局部最大值。 列出有調成分并計算聲壓級.列出無調成分并計算功率.下面的圖3和圖4依次顯示了有調和無調

8、成分的讀取。,2.4 判決有調和無調成分,2.4 判決有調和無調成分,2.5 有調和無調掩蔽成分的抽取,抽取是用來減少掩蔽成分數(shù)目的步驟,它是計算綜合掩蔽閾值時必須考慮的問題。只要有調成分的X(k)之間滿足小于0.5Bark的寬度,就可以抽取這樣的有調成分。方法是列出有調成分,在臨界頻段范圍內采用0.5Bark寬度的滑動窗,若窗內存在兩個或更多的成分,僅保持窗內最高功率的成分,移去所有較小功率的成分。圖5和圖6給出了樣本音頻信號有調成分

9、、無調成分和安靜狀態(tài)閾值的比較。,2.5 有調和無調掩蔽成分的抽取,2.5 有調和無調掩蔽成分的抽取,2.6 單獨掩蔽閾值的計算,通常在所有的N/2個頻率樣點的譜線中,僅僅只有其中一部分頻率樣點的譜線用于綜合掩蔽閾值計算。在最低頻的6個子帶的頻域范圍內的譜線不考慮進行下采樣;接著6個子帶的頻域范圍內的譜線,每隔1個譜線考慮進行下采樣;剩余的最高頻處的18個子帶的頻域范圍內的譜線,每隔4個譜線考慮進行下采樣。將所有考慮進行下采樣的譜線進行

10、下采樣,下采樣的樣點數(shù)n=106。,2.6 單獨掩蔽閾值的計算,對于這108個樣點,經驗給定對應的譜值。對每個序號為k有調無調成分,選擇最接近其譜值X(k)的106樣點譜值中的某個樣點,將該成分序號令為i,i∈{1,2,3,...,106}。j為所有有調、無調成分在抽取后的譜線序號。有調和無調的單獨掩蔽閾值分別由下式計算:,,,2.6 單獨掩蔽閾值的計算,2.6 單獨掩蔽閾值的計算,2.7 總體掩蔽閾值的計算,第i個頻率樣點的總掩蔽閾值

11、LTg(i)是由序號為j的所有有調無調掩蔽成分的單獨掩蔽閾值LTtm[z(j),z(i)] 、LTnm[z(j),z(i)]和安靜狀態(tài)閾值LTq(i)求出的,把相應于單獨掩蔽閾值的功率和安靜狀態(tài)閾值的功率相加可求得總掩蔽閾值:其中,有調掩蔽成分總數(shù)為m,無調掩蔽成分總數(shù)為n。圖9給出了樣本音頻信號的總體掩蔽閾值,即圖中黑色的虛線。,2.7 總體掩蔽閾值的計算,3.仿真結果,仿真文件選擇:1-5.wav仿真數(shù)據(jù)截取:總體掩蔽閾值,4.關

12、于后期工作的想法,基于心理聲學模型的音頻數(shù)據(jù)隱藏方案: 利用宿主音頻信號的心理學模型得到的掩蔽閾值,對偽隨機序列調制后的隱藏消息進行頻域掩蔽,將掩蔽后的偽隨機消息嵌入宿主音頻。利用偽隨機信號的相關性思路的結合,5.總結,心理聲學模型的優(yōu)缺點 采用以宿主音頻信號本身的頻域掩蔽效應來調制隱藏的偽隨機序列,因此被隱藏的偽隨機序列是基于宿主音頻信號內容的,嵌入后具有良好的聽覺不可感知性.但是在變換域中的抗攻擊能力較弱.,5.總

13、結,信息隱藏技術的展望 利用數(shù)字化媒體進行信息隱藏是一個嶄新的研究領域,在應用需求的刺激下得到了迅速的發(fā)展,使其能夠橫跨數(shù)字信號處理、圖像處理、語音處理、模式識別、數(shù)字通信、多媒體技術、密碼學等多個學科,盡管在目前還沒形成完整的理論體系,但由于它是一項與具體應用十分密切的實用技術,隨著數(shù)字化和網絡化的發(fā)展,其應用價值會越發(fā)突出。信息隱藏系統(tǒng)的幾個基本特性之間存在著相互矛盾的一面,例如:隱藏數(shù)據(jù)量和隱藏信息免疫能力之間,不易察覺性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論