2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩170頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)的可用性受到廣泛的關(guān)注。真實(shí)世界會(huì)隨著時(shí)間的流逝迅速變化,進(jìn)而導(dǎo)致數(shù)據(jù)庫(kù)中的數(shù)據(jù)過(guò)時(shí)失效。當(dāng)前已有統(tǒng)計(jì)表明過(guò)時(shí)數(shù)據(jù)會(huì)對(duì)企業(yè)決策和國(guó)民生活造成眾多不良影響,且會(huì)引起其他維度的可用性下降,如引起數(shù)據(jù)不一致、不精確、不完整等,因此確保數(shù)據(jù)的時(shí)效性至關(guān)重要。當(dāng)前數(shù)據(jù)可用性領(lǐng)域?qū)τ跁r(shí)效性的研究仍然不成體系,數(shù)據(jù)時(shí)效性研究面臨極大挑戰(zhàn)。首先,很多數(shù)據(jù)庫(kù)中都沒(méi)有精確可用的時(shí)間戳,這使得數(shù)據(jù)集合在給定時(shí)刻的時(shí)效性,即絕對(duì)時(shí)效性

2、,很難判定。其次,不同的查詢或應(yīng)用場(chǎng)景對(duì)時(shí)效性有不同的要求,在一些情境下絕對(duì)時(shí)效性可能無(wú)法判定,這使得數(shù)據(jù)相對(duì)于查詢或者用戶的時(shí)效性判定尤為重要。第三,在得到數(shù)據(jù)庫(kù)的時(shí)效性判定結(jié)果之后,必須進(jìn)一步給出數(shù)據(jù)時(shí)效性的修復(fù)方法,當(dāng)前數(shù)據(jù)可用性領(lǐng)域的研究并沒(méi)有給出可以直接用于修復(fù)時(shí)效性的數(shù)據(jù)修復(fù)方法。第四,在僅有一個(gè)數(shù)據(jù)源的情況下,完全地修復(fù)一個(gè)數(shù)據(jù)庫(kù)是非常困難,甚至不可行的。因?yàn)椴煌瑪?shù)據(jù)源包含的數(shù)據(jù)不同,所以往往要需要根據(jù)現(xiàn)有知識(shí),將來(lái)自其他

3、數(shù)據(jù)源的數(shù)據(jù)和目標(biāo)數(shù)據(jù)源的最新值整合起來(lái)才能得到完整的目標(biāo)數(shù)據(jù)表最新值。為了有效地應(yīng)對(duì)上述挑戰(zhàn),本文嘗試給出一系列理論和算法,解決了數(shù)據(jù)時(shí)效性的一些關(guān)鍵問(wèn)題,主要研究?jī)?nèi)容可以概括如下。
  (1)本文研究了數(shù)據(jù)絕對(duì)時(shí)效性的表達(dá)原理及判定算法。為了克服當(dāng)前基于時(shí)間戳和基于規(guī)則的兩類時(shí)效性判定方法的局限性,形式化地定義了不確定時(shí)效規(guī)則及相應(yīng)的數(shù)據(jù)時(shí)效性模型。該規(guī)則和模型可以表達(dá)不確定的領(lǐng)域知識(shí),定量地判定數(shù)據(jù)時(shí)效性,且能夠判定數(shù)據(jù)在特

4、定時(shí)刻是否過(guò)時(shí)。在此基礎(chǔ)上,本文首先研究了不確定時(shí)效規(guī)則的基礎(chǔ)問(wèn)題,如公理化、可滿足、蘊(yùn)含等問(wèn)題;然后給出了定量地判定數(shù)據(jù)時(shí)效性的模型,分別定義了數(shù)據(jù)項(xiàng)、元組、數(shù)據(jù)集合的時(shí)效性;接著,將數(shù)據(jù)項(xiàng)間的時(shí)序關(guān)系構(gòu)建成時(shí)序圖,并基于時(shí)序圖給出了多項(xiàng)式時(shí)間的時(shí)效性判定算法;最后在真實(shí)數(shù)據(jù)上的實(shí)驗(yàn)驗(yàn)證了算法的有效性。
  (2)本文研究了數(shù)據(jù)相對(duì)時(shí)效性表達(dá)原理及判定算法。在數(shù)據(jù)的絕對(duì)時(shí)效性無(wú)法判定,或判定結(jié)果不能有效地表達(dá)用戶需求的情況下,可

5、以利用一些冗余記錄和時(shí)效約規(guī)則來(lái)實(shí)現(xiàn)數(shù)據(jù)相對(duì)時(shí)效性的判定。本文借助冗余記錄和時(shí)效規(guī)則研究數(shù)據(jù)相對(duì)時(shí)效性判定問(wèn)題,建立了相對(duì)時(shí)效性的判定模型并提出了相關(guān)求解算法。本文首先定義了查詢相關(guān)時(shí)效性,將查詢歸結(jié)為最新值查詢和時(shí)效序列查詢兩類,對(duì)每類查詢,設(shè)計(jì)了查詢結(jié)果的時(shí)效性判定方法,并將每類查詢作為一個(gè)整體,給出了數(shù)據(jù)集合相對(duì)于一類查詢的平均時(shí)效性判定方法;然后,將用戶按查詢偏好分為3類,研究了用戶相關(guān)時(shí)效性;最后在真實(shí)數(shù)據(jù)和虛擬數(shù)據(jù)上分別進(jìn)行

6、了實(shí)驗(yàn),驗(yàn)證了算法的有效性,分析了各參數(shù)對(duì)算法的影響。
  (3)本文研究了基于規(guī)則的數(shù)據(jù)時(shí)效性錯(cuò)誤修復(fù)模型及修復(fù)算法。將數(shù)據(jù)庫(kù)中的過(guò)時(shí)數(shù)據(jù)修復(fù)為最新值是提高數(shù)據(jù)質(zhì)量的關(guān)鍵步驟。當(dāng)前主要有基于規(guī)則和基于統(tǒng)計(jì)兩類數(shù)據(jù)修復(fù)方法:基于規(guī)則的修復(fù)方法難以表達(dá)數(shù)據(jù)中某些復(fù)雜的關(guān)聯(lián)關(guān)系,而基于統(tǒng)計(jì)的方法需要學(xué)習(xí)較復(fù)雜的條件概率分布,且難以直接應(yīng)用數(shù)據(jù)語(yǔ)義相關(guān)的領(lǐng)域知識(shí)。為了克服上述兩類方法的缺點(diǎn),本文提出一類新的修復(fù)規(guī)則,將規(guī)則和統(tǒng)計(jì)的方法結(jié)

7、合起來(lái)修復(fù)過(guò)時(shí)數(shù)據(jù),該規(guī)則一方面能夠通過(guò)規(guī)則模式表達(dá)領(lǐng)域知識(shí),另一方面還能夠使用其特有的分布表來(lái)描述數(shù)據(jù)隨時(shí)間變化的統(tǒng)計(jì)信息。首先,本文研究了靜態(tài)數(shù)據(jù)上的最小規(guī)則模式生成問(wèn)題,證明了靜態(tài)數(shù)據(jù)上的規(guī)則模式生成問(wèn)題是NP-難的,并給出了兩個(gè)解決該問(wèn)題的多項(xiàng)式時(shí)間近似算法。接著,本文研究了動(dòng)態(tài)數(shù)據(jù)上的最小規(guī)則模式生成問(wèn)題,給出算法可在數(shù)據(jù)動(dòng)態(tài)變化的情況下迅速更新現(xiàn)有的規(guī)則模式集合,最好情況下,只需O(1)時(shí)間即可完成更新。同時(shí),本文還給出了靜

8、態(tài)數(shù)據(jù)上的分布表學(xué)習(xí)算法和數(shù)據(jù)動(dòng)態(tài)變化情況下的分布表更新算法。然后,本文研究了不同修復(fù)代價(jià)約束條件下的最優(yōu)修復(fù)計(jì)劃產(chǎn)生問(wèn)題,證明了在修復(fù)預(yù)算為正無(wú)窮時(shí),該問(wèn)題在多項(xiàng)式時(shí)間內(nèi)可解,否則該問(wèn)題是NP-難的,并給出了上述兩種情況下該問(wèn)題的解決方法。最后本文通過(guò)真實(shí)和虛擬數(shù)據(jù)集合上的實(shí)驗(yàn)證明了上述方法的有效性。
  (4)本文研究了基于查詢的數(shù)據(jù)時(shí)效性錯(cuò)誤修復(fù)問(wèn)題。在數(shù)據(jù)集成或Web環(huán)境下,許多數(shù)據(jù)表被分散地存儲(chǔ)在不同地方,這些數(shù)據(jù)表之間

9、往往存在著部分?jǐn)?shù)據(jù)重疊的情況,但不同數(shù)據(jù)源的更新頻率不盡相同。如果我們向某數(shù)據(jù)源請(qǐng)求一個(gè)數(shù)據(jù)表或發(fā)出一個(gè)查詢,往往會(huì)因?yàn)閿?shù)據(jù)源更新不及時(shí)而無(wú)法得到目標(biāo)數(shù)據(jù)表的最新數(shù)據(jù)。為了將目標(biāo)數(shù)據(jù)表修復(fù)為最新值,需根據(jù)數(shù)據(jù)庫(kù)中的時(shí)序約束和參照完整性約束構(gòu)造一個(gè)合取查詢,使得該查詢的結(jié)果恰由目標(biāo)數(shù)據(jù)表對(duì)應(yīng)的最新值構(gòu)成,稱為時(shí)效保持查詢。本文研究在給定數(shù)據(jù)庫(kù)時(shí)序關(guān)系和參照完整性約束的情況下時(shí)效保持查詢構(gòu)造問(wèn)題。首先,本文給出了時(shí)效保持查詢的形式化定義,使

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論