2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、最全的大數(shù)據(jù)術(shù)語(yǔ)合集大數(shù)據(jù)的出現(xiàn)帶來(lái)了許多新的術(shù)語(yǔ),但這些術(shù)語(yǔ)往往比較難以理解。因此,一亦在國(guó)外的一個(gè)網(wǎng)站上扒來(lái)了常用的大數(shù)據(jù)術(shù)語(yǔ)表,拋磚引玉,供大家深入了解。其中部分定義參考了相應(yīng)的博客文章。當(dāng)然,這份術(shù)語(yǔ)表并沒(méi)有100%包含所有的術(shù)語(yǔ)。一個(gè)常見(jiàn)的大數(shù)據(jù)術(shù)語(yǔ)表大數(shù)據(jù)的出現(xiàn)帶來(lái)了許多新的術(shù)語(yǔ),但這些術(shù)語(yǔ)往往比較難以理解。因此,我們通過(guò)本文給出一個(gè)常用的大數(shù)據(jù)術(shù)語(yǔ)表,拋磚引玉,供大家深入了解。其中部分定義參考了相應(yīng)的博客文章。當(dāng)然,這份術(shù)

2、語(yǔ)表并沒(méi)有100%包含所有的術(shù)語(yǔ),如果你認(rèn)為有任何遺漏之處,請(qǐng)告之我們。A聚合(Aggregation)–搜索、合并、顯示數(shù)據(jù)的過(guò)程算法(Algithms)–可以完成某種數(shù)據(jù)分析的數(shù)學(xué)公式分析法(Analytics)–用于發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在涵義異常檢測(cè)(Anomalydetection)–在數(shù)據(jù)集中搜索與預(yù)期模式或行為不匹配的數(shù)據(jù)項(xiàng)。除了“Anomalies”用來(lái)表示異常的詞有以下幾種:outliersexceptionssurprises

3、contaminants.他們通常可提供關(guān)鍵的可執(zhí)行信息匿名化(Anonymization)–使數(shù)據(jù)匿名,即移除所有與個(gè)人隱私相關(guān)的數(shù)據(jù)應(yīng)用(Application)–實(shí)現(xiàn)某種特定功能的計(jì)算機(jī)軟件人工智能(ArtificialIntelligence)–研發(fā)智能機(jī)器和智能軟件,這些智能設(shè)備能夠感知周遭的環(huán)境,并根據(jù)要求作出相應(yīng)的反應(yīng),甚至能自我學(xué)習(xí)B行為分析法(BehaviouralAnalytics)–這種分析法是根據(jù)用戶的行為如“怎

4、么做”,“為什么這么做”,以及“做了什么”來(lái)得出結(jié)論,而不是僅僅針對(duì)人物和時(shí)間的一門分析學(xué)科,它著眼于數(shù)據(jù)中的人性化模式大數(shù)據(jù)科學(xué)家(BigDataScientist)–能夠設(shè)計(jì)大數(shù)據(jù)算法使得大數(shù)據(jù)變得有用的人大數(shù)據(jù)創(chuàng)業(yè)公司(Bigdatastartup)–指研發(fā)最新大數(shù)據(jù)技術(shù)的新興公司生物測(cè)定術(shù)(Biometrics)–根據(jù)個(gè)人的特征進(jìn)行身份識(shí)別B字節(jié)(BB:Brontobytes)–約等于1000YB(Yottabytes),相當(dāng)于

5、未來(lái)數(shù)字化宇宙的大小。1B字節(jié)包含了27個(gè)0!商業(yè)智能(BusinessIntelligence)–是一系列理論、方法學(xué)和過(guò)程,使得數(shù)據(jù)更容易被理解C分類分析(Classificationanalysis)–從數(shù)據(jù)中獲得重要的相關(guān)性信息的系統(tǒng)化過(guò)程這類數(shù)據(jù)也被稱為元數(shù)據(jù)(metadata)是描述數(shù)據(jù)的數(shù)據(jù)云計(jì)算(Cloudcomputing)–構(gòu)建在網(wǎng)絡(luò)上的分布式計(jì)算系統(tǒng),數(shù)據(jù)是存儲(chǔ)于機(jī)房外的(即云端)聚類分析(Clusteringan

6、alysis)–它是將相似的對(duì)象聚合在一起,每類相似的對(duì)象組合成一個(gè)聚類(也叫作簇)的過(guò)程。這種分析方法的目的在于分析數(shù)據(jù)間的差異和相似性冷數(shù)據(jù)存儲(chǔ)(Colddatastage)–在低功耗服務(wù)器上存儲(chǔ)那些幾乎不被使用的舊數(shù)據(jù)。但這些數(shù)據(jù)檢索起來(lái)將會(huì)很耗時(shí)對(duì)比分析(Comparativeanalysis)–在非常大的數(shù)據(jù)集中進(jìn)行模式匹配時(shí),進(jìn)行一步步的對(duì)比和計(jì)算過(guò)程得到分析結(jié)果復(fù)雜結(jié)構(gòu)的數(shù)據(jù)(Complexstructureddata)–

7、由兩個(gè)或多個(gè)復(fù)雜而相互關(guān)聯(lián)部分組成的數(shù)探索性分析(Explatyanalysis)–在沒(méi)有標(biāo)準(zhǔn)的流程或方法的情況下從數(shù)據(jù)中發(fā)掘模式。是一種發(fā)掘數(shù)據(jù)和數(shù)據(jù)集主要特性的一種方法E字節(jié)(EB:Exabytes)–約等于1000PB(petabytes)約等于1百萬(wàn)GB。如今全球每天所制造的新信息量大約為1EB提取轉(zhuǎn)換加載(ETL:ExtractTransfmLoad)–是一種用于數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)的處理過(guò)程。即從各種不同的數(shù)據(jù)源提取(E)數(shù)據(jù)

8、,并轉(zhuǎn)換(T)成能滿足業(yè)務(wù)需要的數(shù)據(jù),最后將其加載(L)到數(shù)據(jù)庫(kù)F故障切換(Failover)–當(dāng)系統(tǒng)中某個(gè)服務(wù)器發(fā)生故障時(shí),能自動(dòng)地將運(yùn)行任務(wù)切換到另一個(gè)可用服務(wù)器或節(jié)點(diǎn)上容錯(cuò)設(shè)計(jì)(Faulttolerantdesign)–一個(gè)支持容錯(cuò)設(shè)計(jì)的系統(tǒng)應(yīng)該能夠做到當(dāng)某一部分出現(xiàn)故障也能繼續(xù)運(yùn)行G游戲化(Gamification)–在其他非游戲領(lǐng)域中運(yùn)用游戲的思維和機(jī)制,這種方法可以以一種十分友好的方式進(jìn)行數(shù)據(jù)的創(chuàng)建和偵測(cè),非常有效。圖形數(shù)據(jù)

9、庫(kù)(GraphDatabases)–運(yùn)用圖形結(jié)構(gòu)(例如,一組有限的有序?qū)Γ蛘吣撤N實(shí)體)來(lái)存儲(chǔ)數(shù)據(jù),這種圖形存儲(chǔ)結(jié)構(gòu)包括邊緣、屬性和節(jié)點(diǎn)。它提供了相鄰節(jié)點(diǎn)間的自由索引功能,也就是說(shuō),數(shù)據(jù)庫(kù)中每個(gè)元素間都與其他相鄰元素直接關(guān)聯(lián)。網(wǎng)格計(jì)算(Gridcomputing)–將許多分布在不同地點(diǎn)的計(jì)算機(jī)連接在一起,用以處理某個(gè)特定問(wèn)題,通常是通過(guò)云將計(jì)算機(jī)相連在一起。Hhadoop–一個(gè)開(kāi)源的分布式系統(tǒng)基礎(chǔ)框架,可用于開(kāi)發(fā)分布式程序,進(jìn)行大數(shù)據(jù)的

10、運(yùn)算與存儲(chǔ)。Hadoop數(shù)據(jù)庫(kù)(HBase)–一個(gè)開(kāi)源的、非關(guān)系型、分布式數(shù)據(jù)庫(kù),與Hadoop框架共同使用HDFS–Hadoop分布式文件系統(tǒng)(HadoopDistributedFileSystem);是一個(gè)被設(shè)計(jì)成適合運(yùn)行在通用硬件(commodityhardware)上的分布式文件系統(tǒng)高性能計(jì)算(HPC:HighPerfmanceComputing)–使用超級(jí)計(jì)算機(jī)來(lái)解決極其復(fù)雜的計(jì)算問(wèn)題I內(nèi)存數(shù)據(jù)庫(kù)(IMDB:Inmemy)–一

11、種數(shù)據(jù)庫(kù)管理系統(tǒng),與普通數(shù)據(jù)庫(kù)管理系統(tǒng)不同之處在于,它用主存來(lái)存儲(chǔ)數(shù)據(jù),而非硬盤。其特點(diǎn)在于能高速地進(jìn)行數(shù)據(jù)的處理和存取。物聯(lián)網(wǎng)(InterofThings)–在普通的設(shè)備中裝上傳感器,使這些設(shè)備能夠在任何時(shí)間任何地點(diǎn)與網(wǎng)絡(luò)相連。J法律上的數(shù)據(jù)一致性(Juridicaldatacompliance)–當(dāng)你使用的云計(jì)算解決方案,將你的數(shù)據(jù)存儲(chǔ)于不同的國(guó)家或不同的大陸時(shí),就會(huì)與這個(gè)概念扯上關(guān)系了。你需要留意這些存儲(chǔ)在不同國(guó)家的數(shù)據(jù)是否符合當(dāng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論