

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、孤立點(diǎn)數(shù)據(jù)挖掘技術(shù)在審計信息化中的應(yīng)用研究孤立點(diǎn)數(shù)據(jù)挖掘技術(shù)在審計信息化中的應(yīng)用研究ApplicationofauditingInfmationizationwiththeOutlierDataMingTechnology周喜曾麗(湖南商學(xué)院,會計學(xué)院,湖南長沙410205)摘要:孤立點(diǎn)分析技術(shù)是數(shù)據(jù)挖掘的重要內(nèi)容之一,可廣泛應(yīng)用到電信、信用卡欺騙檢測、貸款審批、客戶分類、氣象預(yù)報和網(wǎng)絡(luò)入侵檢測等領(lǐng)域。在審計工作中,也可采用孤立點(diǎn)檢測算
2、法對審計數(shù)據(jù)進(jìn)行判斷和檢測是否存在異常,幫助審計人員及時發(fā)現(xiàn)隱藏的審計線索,提高審計效率,孤立點(diǎn)數(shù)據(jù)挖掘技術(shù)比發(fā)現(xiàn)規(guī)律性的其他挖掘技術(shù)具有更好的現(xiàn)實(shí)應(yīng)用價值。關(guān)鍵詞:審計信息化;孤立點(diǎn)分析;數(shù)據(jù)挖掘一、引言:一、引言:隨著信息技術(shù)的不斷發(fā)展及企業(yè)數(shù)據(jù)庫管理信息系統(tǒng)的數(shù)據(jù)海量增加,傳統(tǒng)以查賬為主審計方法將遇到計算機(jī)技術(shù)的挑戰(zhàn),讓審計人員不得不重新調(diào)整作業(yè)方法,選擇計算機(jī)審計方式檢查被審計單位的經(jīng)濟(jì)活動,發(fā)揮現(xiàn)代審計監(jiān)督的作用[1]。目前,
3、雖然有許多通用軟件公司開發(fā)了相關(guān)的審計人員,也加快了我國審計信息化的步伐,但也由于這些軟件的功能較局限,讓企業(yè)審計信息化的內(nèi)容基本是傳統(tǒng)審計方法及流程計算機(jī)化而已。如審計人員依據(jù)統(tǒng)計方法、法律規(guī)則以及審計經(jīng)驗(yàn)建立查詢分析模型,然后對被審計單位的業(yè)務(wù)上可能違規(guī)的現(xiàn)象做一個假設(shè),再通過電子數(shù)據(jù)來檢驗(yàn)假設(shè),這都要求審計人員有非常豐富的工作經(jīng)驗(yàn),而違規(guī)假設(shè)方法也大大增加了審計人員的工作量。這種方法先進(jìn)的信息技術(shù)含量較少,也嚴(yán)重影響了我國審計信息
4、化的發(fā)展深度,如何充分利用先進(jìn)信息化技術(shù),如孤立點(diǎn)分析技術(shù)去發(fā)現(xiàn)海量數(shù)據(jù)中隱藏或未知的信息,讓“智能”的數(shù)據(jù)處理方法幫助審計人員迅速發(fā)現(xiàn)異常交易或事項(xiàng),快速確定審計事項(xiàng)及重點(diǎn),提高審計效率,降低審計成本及風(fēng)險,是未來審計信息化研究的重點(diǎn)和難點(diǎn)[2]。目前,國內(nèi)研究審計軟件、審計信息化和數(shù)據(jù)挖掘在審計中的應(yīng)用的學(xué)者并不多,其中,著名的學(xué)者有南京審計學(xué)院陳偉副教授對審計軟件現(xiàn)狀及發(fā)展趨勢、基于數(shù)據(jù)匹配技術(shù)的審計證據(jù)獲取方法和信息系統(tǒng)審計新的
5、安全服務(wù)模式都進(jìn)行了較深的研究;呂新民教授對信息化環(huán)境下審計項(xiàng)目管理及數(shù)據(jù)挖掘在審計數(shù)據(jù)分析中的應(yīng)用方面都出了研究水平較高的學(xué)術(shù)論文;陳丹萍教授和杭州電子科技大學(xué)辛金國等人對基于數(shù)據(jù)挖掘技術(shù)的聯(lián)網(wǎng)審計進(jìn)行了較深入的研究;華南理工大學(xué)的張炳才等人對基于歐式距離孤立點(diǎn)挖掘方法在審計中的應(yīng)用進(jìn)行了相關(guān)的研究等。二、數(shù)據(jù)挖掘技術(shù)二、數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘是從大量的、不完全的、隨機(jī)的、模糊的和在噪聲的實(shí)際應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)趨勢、規(guī)則和模式的過程,他融合
6、了現(xiàn)代統(tǒng)計、決策理論、數(shù)據(jù)庫管理和機(jī)器學(xué)習(xí)等多學(xué)科的知識,這門廣義的交叉學(xué)科徽劇了不同領(lǐng)域的研究者,的局部孤立點(diǎn),也不會遺漏周圍的孤立點(diǎn)數(shù)據(jù),這種檢測方法放棄了以前絕對孤立點(diǎn)觀點(diǎn),并納入局部孤立點(diǎn)的內(nèi)容,也更貼近Hawkins的孤立點(diǎn)定義。34基于聚類的孤立點(diǎn)檢測方法傳統(tǒng)的大部分聚類算法如Sting、Dbscan、Clarans等都具有異常數(shù)據(jù)的處理能力,這些聚類數(shù)據(jù)挖掘算法主要目標(biāo)是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類,產(chǎn)生對人們有意義的聚類
7、信息,孤立點(diǎn)的產(chǎn)生只是副產(chǎn)品而已。在聚類數(shù)據(jù)挖掘處理過程中,這些算法將數(shù)據(jù)集中異常的事項(xiàng)作為噪音而忽略或容忍,雖然不利于異常信息的檢測,但其最大的優(yōu)點(diǎn)就是掃描數(shù)據(jù)集的效率較高,適應(yīng)于大規(guī)模數(shù)據(jù)集。35基于偏離的孤立點(diǎn)檢測方法基于偏離的孤立點(diǎn)檢測不采用統(tǒng)計(分布)和基于距離的度量值來發(fā)現(xiàn)和確定異常數(shù)據(jù),它是通過對檢測數(shù)據(jù)集的主要特征來確定孤立點(diǎn)的,所有與給出的主要特征描述“偏離”的數(shù)據(jù)集都被認(rèn)為是孤立點(diǎn)。基于偏離的方法主要檢測技術(shù)有序列異
8、常技術(shù)和OLAP數(shù)據(jù)立方體技術(shù)。36基于深度的孤立點(diǎn)檢測方法基于深度的孤立點(diǎn)檢測方法中,數(shù)據(jù)集中的每一個數(shù)據(jù)都被映射為維空間中的一個點(diǎn),同時也定義了其深度,根據(jù)不同的深度將這些數(shù)據(jù)劃分成不同的層次。整個劃分過程中,異常數(shù)據(jù)一般都是被劃分到較淺層次的數(shù)據(jù),這些數(shù)據(jù)是孤立點(diǎn)的可能性較大。此方法存在的缺陷是對四維及四維以上的數(shù)據(jù)處理效率較低,只適合對二維和三維空間上的數(shù)據(jù)檢測。四、孤立點(diǎn)技術(shù)在審計信息化中的應(yīng)用四、孤立點(diǎn)技術(shù)在審計信息化中的應(yīng)
9、用41基于孤立點(diǎn)分析的審計數(shù)據(jù)挖掘模型基于孤立點(diǎn)分析的審計數(shù)據(jù)挖掘模型主要包括:數(shù)據(jù)預(yù)處理模塊、孤立點(diǎn)檢測模塊、孤立點(diǎn)算法庫、孤立點(diǎn)規(guī)則庫等?;诠铝Ⅻc(diǎn)分析的審計數(shù)據(jù)挖掘模型原理可簡述如下,首先將采集到的原始審計數(shù)據(jù)進(jìn)行預(yù)處理,目的是過濾無用的數(shù)據(jù)和將原始數(shù)據(jù)轉(zhuǎn)換為孤立點(diǎn)數(shù)據(jù)挖掘算法能識別的格式;然后從孤立點(diǎn)算法庫中選擇相應(yīng)的算法對轉(zhuǎn)換后的數(shù)據(jù)執(zhí)行孤立點(diǎn)數(shù)據(jù)挖掘,并得到隱含孤立點(diǎn);再將這些隱含孤立點(diǎn)與孤立點(diǎn)規(guī)則庫中的模式進(jìn)行比較,把數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 孤立點(diǎn)數(shù)據(jù)挖掘技術(shù)研究及應(yīng)用.pdf
- 數(shù)據(jù)挖掘技術(shù)及其聚類方法在審計中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘在審計數(shù)據(jù)分析中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘技術(shù)在審計過程中的應(yīng)用研究.pdf
- 數(shù)據(jù)挖掘技術(shù)在信息化建設(shè)中的應(yīng)用
- 數(shù)據(jù)挖掘技術(shù)在教育信息化中的應(yīng)用研究.pdf
- 數(shù)據(jù)挖掘在國稅信息化中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘在電信信息化系統(tǒng)中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘研究在信息化中的應(yīng)用研究
- 大數(shù)據(jù)技術(shù)在審計實(shí)務(wù)中的應(yīng)用研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院信息化建設(shè)應(yīng)用研究.pdf
- 利用數(shù)據(jù)挖掘技術(shù)淺析校園信息化服務(wù)推廣
- 數(shù)據(jù)挖掘技術(shù)在金融審計中的應(yīng)用
- 元數(shù)據(jù)及其在審計系統(tǒng)中的應(yīng)用.pdf
- 醫(yī)院信息化改造工程——多維數(shù)據(jù)技術(shù)在醫(yī)院信息化中的應(yīng)用.pdf
- 多維數(shù)據(jù)分析在審計實(shí)踐中的應(yīng)用
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘及其在稅務(wù)信息化中的應(yīng)用研究.pdf
- 南都電源公司信息化系統(tǒng)中數(shù)據(jù)挖掘的研究和應(yīng)用.pdf
- 審計信息化建設(shè)的應(yīng)用分析
- “敏感分析”在審計中的應(yīng)用
評論
0/150
提交評論