基于tms320c6678的語種識別并行算法設計與實現(xiàn)_第1頁
已閱讀1頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、基于基于TMS320C6678的語種識別并行算法設計與實現(xiàn)的語種識別并行算法設計與實現(xiàn)吉立新,劉偉偉,李邵梅時間:2012年12月03日來源:電子技術應用2012年第10期摘要:要:針對語種識別在實際應用中的實時性需求,在分析語種識別算法原理和多核DSP任務并行的基礎上,設計了一種基于TMS320C6678的語種識別算法并行實現(xiàn)方法。該方法實現(xiàn)了任務級并行流水和核間高效通信。實驗結(jié)果表明,該方法可靠、有效,并且使該系統(tǒng)至少能夠完成132

2、路的實時識別任務。關鍵詞:關鍵詞:語種識別;多核DSP;TMS320C6678;并行處理語種識別是計算機通過分析處理一個語音片段,判別其所屬語言種類的過程[1]。語種識別的任務在于快速準確地識別出語言的種類,自上世紀90年代以來,已經(jīng)成為通信和信息領域一個新的學科增長點,在多語種信息服務、機器翻譯及軍事安全等領域都有著廣泛的應用前景[2]。語種識別走向?qū)嵱没?,不僅要有令人滿意的識別性能,其實時處理的效率也是必須要考慮的因素。因此,設計能

3、夠?qū)崿F(xiàn)多路實時處理的語種識別系統(tǒng)是語種識別邁出實用化的關鍵一步。本文針對語種識別系統(tǒng)算法的特點,設計了一種基于TI多核處理器TMS320C6678的語種識別并行實現(xiàn)方法,實現(xiàn)了任務級的并行流水處理和核間的高效通信。1平臺介紹平臺介紹TMS320C6678是基于TI公司最新DSP系列器件TMS320C66x、采用8個1.25GHzDSP內(nèi)核構(gòu)建而成的業(yè)界首款10GHzDSP,可在10W功耗下實現(xiàn)160GFLOP(GigaFloatingP

4、ointOperationsperSecond)浮點計算性能[3]。不僅能整合多個DSP以縮小板級空間并降低成本,同時還能減少整體的功耗要求,充分滿足現(xiàn)代數(shù)字信號處理日益增長的需求。本文語種識別系統(tǒng)的開發(fā)在TI公司的最新DSP集成開發(fā)環(huán)境CCSv5(CodeComposerStudio)中基于浮點運算設計完成。2基于基于TMS320C6678TMS320C6678的語種識別算法優(yōu)化的語種識別算法優(yōu)化2.12.1語種識別算法分解語種識別算

5、法分解本文的語種識別系統(tǒng)是基于區(qū)分性ModelPushing算法[4]進行構(gòu)建的,并且對特征參數(shù)進行了fDWNAP[56]處理,因此系統(tǒng)的測試階段由特征提取模塊、fDWNAP模塊及對數(shù)似然得分模塊3個模塊構(gòu)成,如圖1所示。(1)特征提取模塊特征提取模塊的任務包括語音信號預處理、MFCC提取、RASTA濾波、SDC擴展、VAD檢測、CMS處理、高斯化等過程,該模塊結(jié)束即輸出56維的特征參數(shù),其需要存儲的參數(shù)包括漢明窗和梅爾濾波器組總共不到

6、2KB。(2)fDWNAP模塊該模塊的工作是對所提取的56維特征參數(shù)進行處理,以去除與語種無關的各種干擾信息,達到凈化語種特征參數(shù)的目的。如參考文獻[6]介紹,該模塊首先將特征參數(shù)映射至SVM的高維空間,然后利用訓練得到的投影矩陣計算映射后的參數(shù)中所包含的干擾信息,再將干擾信息映射至特征空間,從而進行去除。該模塊中事先訓練得到的投影矩陣P=IwwT,wwT是對稱矩陣,因此存儲wwT需要7MB的存儲空間。另外,KL變換矩陣D是對角矩陣,需

7、要112KB的存儲空間。(3)對數(shù)似然得分模塊如參考文獻[4]所述,本模塊主要任務是利用訓練得到的各語種GMM模型對語音特征參數(shù)計算對數(shù)似然得分進行輸出的判決。本模塊需要存儲訓練階段得到的各目標語種的GMM模型及非目標語種的GMM模型,即針對每個語種需要存儲2個GMM模型。所有的GMM模型只是均值矢量不同,高斯混元權(quán)重及協(xié)方差矩陣都是共享UBM模型的。以L個語種為例,需要存儲2L個均值矢量,即需要224LKB的存儲空間,共享的高斯混元權(quán)

8、重需要2KB的存儲空間,協(xié)方差矩陣由于是對角化的只需要112KB的存儲空間。2.22.2算法實時性分析算法實時性分析由以上分析可以看到,算法優(yōu)化后的系統(tǒng)耗時由22.3s減少至1.36s,下降非常明顯,其中下降最多的是fDWNAP模塊和對數(shù)似然得分模塊。在整個系統(tǒng)中,經(jīng)過算法優(yōu)化,fDWNAP模塊耗時所占比例依舊最大,因此在多核任務并行設計時,需要將該模塊的任務進行分解。3基于基于TMS320C6678TMS320C6678的語種識別算法

9、并行設計的語種識別算法并行設計3.13.1模塊間通信分析模塊間通信分析根據(jù)語種識別的系統(tǒng)結(jié)構(gòu),測試過程分為3個模塊,各模塊的算法都已經(jīng)進行了相應的優(yōu)化。這些模塊相互配合,通過控制信號完成數(shù)據(jù)流的交互。任務的控制流程主要是模塊的執(zhí)行次序,任務分配在不同核上的模塊之間以傳遞消息的方式實現(xiàn)同步。模塊間數(shù)據(jù)的傳遞會造成相應的時間延遲,因此,控制流程的設計準則為最大化系統(tǒng)的處理能力。模塊間的數(shù)據(jù)流程主要是數(shù)據(jù)的傳輸方向,描述模塊與外部數(shù)據(jù)間的相互

10、關系。相反,最小化模塊間的數(shù)據(jù)通信量則是數(shù)據(jù)流程的設計準則。語種識別系統(tǒng)算法各模塊間控制流程和數(shù)據(jù)流程的通信示意圖如圖2所示。該圖由數(shù)據(jù)層和控制層兩部分構(gòu)成,控制信號的傳輸由虛線箭頭表示,數(shù)據(jù)的傳輸由實線箭頭表示。3.23.2模塊任務的核映射模塊任務的核映射為了充分利用所有內(nèi)核CPU的計算資源以最大限度地提高系統(tǒng)處理速度,根據(jù)算法優(yōu)化前后的系統(tǒng)實時性測試結(jié)果及各模塊運算量分析,將fDWNAP模塊的矩陣乘法任務分配到多個核并行執(zhí)行。因本文

11、的語種識別系統(tǒng)適合于數(shù)據(jù)流模式的任務并行方式,將整個系統(tǒng)的運算任務適當?shù)胤峙浣o各個內(nèi)核,實現(xiàn)任務級的并行流水。由于fDWNAP模塊計算復雜度大,制約了整個系統(tǒng)任務級流水的處理速度。為了充分發(fā)揮TMS320C6678的性能優(yōu)勢,將該模塊任務映射到多個核進行處理。該模塊首先需要計算特征矢量對應的自適應GSV;然后通過投影矩陣計算SVM特征域的干擾空間,這一部分的大矩陣乘法占據(jù)了整個模塊的絕大部分運算量;最后還需要將干擾空間返回映射到特征域,

12、并在特征域去除干擾。整個模塊80%以上的運算量都集中在大矩陣的乘法上,故采用將大矩陣拆為小矩陣分配到多個核上并行運算,將其他任務集中在一個核上進行處理。在該模塊內(nèi)還是一個任務級的流水處理方式,矩陣相乘部分是核級相同的并行流水處理方式。4基于基于TMS320C6678TMS320C6678的語種識別算法實現(xiàn)的語種識別算法實現(xiàn)4.14.1語種識別算法在語種識別算法在TMS320C6678TMS320C6678中的實現(xiàn)中的實現(xiàn)根據(jù)設計思路,將

13、本文提出的語種識別算法在CCSv5上進行軟件仿真。其中,利用SYSBIOS[8]提供核間任務調(diào)度,利用IPC[9]實現(xiàn)核間同步和通信。啟動系統(tǒng),完成所有核的初始化后,首先調(diào)用IPC_start函數(shù)讓各核進入同步等待狀態(tài),然后各核上的程序才能開始執(zhí)行。從共享存儲器劃出MSM_IN和MSM_OUT2塊存儲區(qū),MSM_IN存儲KL變換矩陣和各語種GMM模型,MSM_OUT存儲判決輸出結(jié)果。投影矩陣數(shù)據(jù)存儲在外接DDR3存儲器中的位置信息事先存

14、在Ce1中。Ce1將投影矩陣數(shù)據(jù)分成5份,通過Notify_sendEvent函數(shù)將5份數(shù)據(jù)的地址發(fā)送到Ce2、Ce3、Ce4、Ce5和Ce6。Ce2、Ce3、Ce4、Ce5和Ce6上的子矩陣乘法任務一直處于懸掛狀態(tài),直到Ce1發(fā)送過來數(shù)據(jù)地址,矩陣乘法任務才開始并行執(zhí)行。各核分別根據(jù)數(shù)據(jù)地址從外接DDR3讀取數(shù)據(jù)與Ce1傳遞的數(shù)據(jù)計算干擾因子向量,計算完畢再利用MessageQ_put函數(shù)將干擾因子向量數(shù)據(jù)的Message寫入到Ce1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論