眾賞文庫(kù)
全部分類
  • 抗擊疫情 >
    抗擊疫情
    病毒認(rèn)知 防護(hù)手冊(cè) 復(fù)工復(fù)產(chǎn) 應(yīng)急預(yù)案 防控方案 英雄事跡 院務(wù)工作
  • 成品畢設(shè) >
    成品畢設(shè)
    外文翻譯 畢業(yè)設(shè)計(jì) 畢業(yè)論文 開(kāi)題報(bào)告 文獻(xiàn)綜述 任務(wù)書(shū) 課程設(shè)計(jì) 相關(guān)資料 大學(xué)生活 期刊論文 實(shí)習(xí)報(bào)告
  • 項(xiàng)目策劃 >
    項(xiàng)目策劃
    土地準(zhǔn)備 規(guī)劃設(shè)計(jì) 開(kāi)工開(kāi)盤 項(xiàng)目綜合 竣工移交 售后移交 智慧方案 安全專項(xiàng) 環(huán)境影響評(píng)估報(bào)告 可行性研究報(bào)告 項(xiàng)目建議書(shū) 商業(yè)計(jì)劃書(shū) 危害評(píng)估防治 招投標(biāo)文件
  • 專業(yè)資料 >
    專業(yè)資料
    人文法律 環(huán)境安全 食品科學(xué) 基礎(chǔ)建設(shè) 能源化工 農(nóng)林牧畜 綜合待分類 教育經(jīng)驗(yàn) 行政人力 企業(yè)管理 醫(yī)學(xué)衛(wèi)生 IT技術(shù) 土木建筑 考研專題 財(cái)會(huì)稅務(wù) 公路隧道 紡織服裝
  • 共享辦公 >
    共享辦公
    總結(jié)匯報(bào) 調(diào)研報(bào)告 工作計(jì)劃 述職報(bào)告 講話發(fā)言 心得體會(huì) 思想?yún)R報(bào) 事務(wù)文書(shū) 合同協(xié)議 活動(dòng)策劃 代理加盟 技術(shù)服務(wù) 求職簡(jiǎn)歷 辦公軟件 ppt模板 表格模板 融資協(xié)議 發(fā)言演講 黨團(tuán)工作 民主生活
  • 學(xué)術(shù)文檔 >
    學(xué)術(shù)文檔
    自然科學(xué) 生物科學(xué) 天文科學(xué) 醫(yī)學(xué)衛(wèi)生 工業(yè)技術(shù) 航空、航天 環(huán)境科學(xué)、安全科學(xué) 軍事 政學(xué) 文化、科學(xué)、教育、 交通運(yùn)輸 經(jīng)濟(jì) 語(yǔ)言、文字 文學(xué) 農(nóng)業(yè)科學(xué) 社會(huì)科學(xué)總論 藝術(shù) 歷史、地理 哲學(xué) 數(shù)理科學(xué)和化學(xué) 綜合性圖書(shū) 哲學(xué)宗教
  • 經(jīng)營(yíng)營(yíng)銷 >
    經(jīng)營(yíng)營(yíng)銷
    綜合文檔 經(jīng)濟(jì)財(cái)稅 人力資源 運(yùn)營(yíng)管理 企業(yè)管理 內(nèi)控風(fēng)控 地產(chǎn)策劃
  • 教學(xué)課件 >
    教學(xué)課件
    幼兒教育 小學(xué)教育 初中教育 高中教育 職業(yè)教育 成人教育 高等教育 考研資源 試題真題 作業(yè)習(xí)題 課后答案 綜合教學(xué)
  • 土木建筑 >
    土木建筑
    專項(xiàng)施工 應(yīng)急預(yù)案 建筑規(guī)范 工藝方案 技術(shù)交底 施工表格 圖片圖集
  • 課程導(dǎo)學(xué) >
    課程導(dǎo)學(xué)
    醫(yī)學(xué)綜合 中醫(yī)養(yǎng)生 醫(yī)學(xué)研究 身心發(fā)展 醫(yī)學(xué)試題 影像醫(yī)學(xué) 醫(yī)院辦公 外科醫(yī)學(xué) 老年醫(yī)學(xué) 內(nèi)科醫(yī)學(xué) 婦產(chǎn)科 神經(jīng)科 醫(yī)學(xué)課件 眼鼻喉科 皮膚病科 腫瘤科 兒科醫(yī)學(xué) 康復(fù)醫(yī)學(xué) 全科醫(yī)學(xué) 護(hù)理學(xué)科 針灸學(xué)科 重癥學(xué)科 病毒學(xué)科 獸醫(yī) 藥學(xué)
    • 簡(jiǎn)介:網(wǎng)絡(luò)的飛速發(fā)展使得對(duì)高質(zhì)量的WEB文本信息檢索的需求變得空前的迫切。而要提高檢索系統(tǒng)的性能,除了改進(jìn)和提高檢索方法的性能,還必須加強(qiáng)對(duì)主題相關(guān)信息的收集和加工,以獲得有效的檢索資源。本文對(duì)面向用戶興趣文檔的主題相關(guān)信息的智能檢索進(jìn)行了研究,其宗旨是進(jìn)一步提高WEB信息檢索的服務(wù)質(zhì)量,主要內(nèi)容包括事件相關(guān)文檔的檢索和事件重要信息的抽取與集成。取得了以下一些研究成果第一、提出了一種自動(dòng)獲取事件框架的方法。首先,建立災(zāi)難性事件的統(tǒng)一框架;然后在統(tǒng)一框架的基礎(chǔ)上使用BOOTSTRAPPING方法獲取關(guān)鍵詞;最后通過(guò)對(duì)相關(guān)句子進(jìn)行聚類得到最終的框架知識(shí)結(jié)構(gòu)。將框架應(yīng)用到與主題相關(guān)檢索有效地降低其他事件的干擾,使事件相關(guān)文檔的檢索性能明顯提高。第二、實(shí)現(xiàn)了一個(gè)事件關(guān)鍵信息的抽取與集成系統(tǒng),本系統(tǒng)具有如下特色(1)在進(jìn)行事件抽取時(shí),首先利用句型模板構(gòu)造抽取規(guī)則,然后直接從經(jīng)過(guò)基本短語(yǔ)識(shí)別、時(shí)間短語(yǔ)和空間短語(yǔ)識(shí)別和規(guī)范化處理的文本中抽取事件信息,從而跳過(guò)了深層句法分析,降低了實(shí)現(xiàn)系統(tǒng)的難度;(2)利用框架間的相似性,提高資源重用度。(3)利用事件的規(guī)范化的時(shí)空信息關(guān)聯(lián)不同文檔中的同一事件,實(shí)現(xiàn)了事件合并,并提出按時(shí)間流順序的線索性文件抽取的輸出方式。第三,系統(tǒng)地分析了中文機(jī)構(gòu)名的特點(diǎn)與命名實(shí)體識(shí)別在機(jī)構(gòu)名識(shí)別上的諸多難點(diǎn),提出統(tǒng)計(jì)和規(guī)則相結(jié)合的中文機(jī)構(gòu)名識(shí)別法。即采用統(tǒng)計(jì)的方法在訓(xùn)練語(yǔ)料庫(kù)中獲取機(jī)構(gòu)名知識(shí)庫(kù),然后根據(jù)機(jī)構(gòu)名特點(diǎn)設(shè)計(jì)了機(jī)構(gòu)名識(shí)別的規(guī)則。在統(tǒng)計(jì)與規(guī)則的結(jié)合下獲得了較好的機(jī)構(gòu)名識(shí)別效果。第四,本文集成了災(zāi)難性事件信息檢索和信息抽取系統(tǒng)。將信息檢索與信息抽取結(jié)合起來(lái)為用戶提供更精確、更容易閱讀的信息服務(wù)。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 78
      11人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 74
      22人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:掃描文檔圖像已經(jīng)成為電子政務(wù)中辦公文檔、數(shù)字圖書(shū)館中圖書(shū)資料等媒體信息的主要表現(xiàn)形式,如何對(duì)其進(jìn)行高比率壓縮已成一個(gè)迫切需要研究的問(wèn)題。本文作者提出了掃描文檔圖像處理與壓縮的總體流程并設(shè)計(jì)了掃描文檔圖像壓縮和解壓縮的系統(tǒng),重點(diǎn)對(duì)其關(guān)鍵技術(shù)及其壓縮處理系統(tǒng)進(jìn)行了研究。其主要工作包括如下首先,對(duì)掃描文檔圖像其本身特征進(jìn)行了研究與分析,指出了掃描文檔圖像壓縮處理系統(tǒng)應(yīng)具備的功能特性。在圖像壓縮之前對(duì)圖像進(jìn)行一系列預(yù)處理,能夠獲得更好的圖像視覺(jué)效果。預(yù)處理方法主要包括有背景去噪和文字增強(qiáng)等。第二,提出了一種基于興趣域的掃描文檔圖像的壓縮與處理方法,在壓縮之前先對(duì)圖像進(jìn)行分割,將一幅圖像分成兩個(gè)層文本層和插圖層。把分割出來(lái)的文本層作為興趣域,插圖層則相應(yīng)的為非興趣域,然后針對(duì)掃描文檔圖像本身的特性對(duì)各層進(jìn)行壓縮與解壓縮,以求達(dá)到比通用圖像壓縮算法更高的壓縮比。第三,分別對(duì)文本層和插圖層進(jìn)行壓縮,壓縮采用的方法依次為亞抽樣、小波變換、零樹(shù)編碼和算術(shù)熵編碼;解壓縮過(guò)程為算術(shù)熵解碼、零樹(shù)解碼、小波逆變換和圖像平滑。第四,壓縮數(shù)據(jù)傳輸時(shí)采用了一種特殊的漸進(jìn)傳輸方法,根據(jù)用戶需要分兩次傳輸,可有效的降低對(duì)傳輸帶寬的要求。第五,相應(yīng)于壓縮方案,對(duì)解壓獲得的重建圖像進(jìn)行后處理,主要包括圖像平滑放大和圖像效果增強(qiáng)。最后,開(kāi)發(fā)了實(shí)現(xiàn)上述內(nèi)容的軟件,做到了理論與實(shí)踐相結(jié)合。本文研究的思想、方法和實(shí)現(xiàn)技術(shù)絕大多數(shù)都可以在數(shù)字圖書(shū)館和基于網(wǎng)絡(luò)的電子政務(wù)中直接應(yīng)用。該論文的主要?jiǎng)?chuàng)新點(diǎn)有兩個(gè)一個(gè)是在圖像壓縮之前采用了圖像分割的方法,有利于更好的針對(duì)圖像的自身特點(diǎn)對(duì)之進(jìn)行有效的壓縮;另一個(gè)是采用了一種結(jié)合興趣域和漸進(jìn)傳輸?shù)膾呙栉臋n圖像的壓縮和傳輸方法,使得圖像的壓縮比和傳輸性能達(dá)到最好的平衡。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 52
      4人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,信息大量膨脹和聚集,XMLEXTENSIBLEMARKUPLANGUAGE作為一種常用的數(shù)據(jù)交換和傳輸標(biāo)準(zhǔn),蘊(yùn)含了豐富的信息。因此,對(duì)XML,文檔的挖掘已經(jīng)成為WEB挖掘一個(gè)新的研究熱點(diǎn)。本文重點(diǎn)對(duì)XML文檔分類方法進(jìn)行了研究。XML文檔的結(jié)構(gòu)特征是XML文檔分類區(qū)別于文本分類的一個(gè)重要方面,這使很多成熟的文本分類算法無(wú)法應(yīng)用到XML文檔分類中。因此,本文重點(diǎn)對(duì)XML文檔的結(jié)構(gòu)特征進(jìn)行了研究。首先,給出一種頻率。路徑模型來(lái)表示XML文檔的結(jié)構(gòu),該模型中不但保存了節(jié)點(diǎn)的標(biāo)簽信息,同時(shí)統(tǒng)計(jì)了相同路徑出現(xiàn)的頻率,使得在保證不丟失有效信息的前提下大大減小了原來(lái)路徑模型的規(guī)模。其次,在頻率路徑模型的基礎(chǔ)上,給出一種帶位置權(quán)重的基于路徑的XML文檔結(jié)構(gòu)相似度計(jì)算方法WLCSWEIGHTEDLONGESTCOMMONSUBSEQUENCE。該方法在路徑匹配時(shí),使用最長(zhǎng)公共子序列方法,能夠捕捉到現(xiàn)有路徑匹配方法漏掉的有效信息;在進(jìn)行路徑相似度計(jì)算時(shí),引入位置權(quán)重向量,將路徑節(jié)點(diǎn)的位置信息考慮在內(nèi)。通過(guò)在真實(shí)數(shù)據(jù)集上做實(shí)驗(yàn)表明WLCS方法召回率和準(zhǔn)確率均高于當(dāng)前存在的基于路徑計(jì)算相似度的方法。再次,基于頻率路徑模型給出一種新的XML文檔結(jié)構(gòu)向量化方法。該方法使用一種基于路徑頻率的信息增益方法選擇特征路徑,使用WLCS方法中的路徑相似度計(jì)算方法生成特征路徑向量,并通過(guò)實(shí)驗(yàn)說(shuō)明該方法的有效性。最后,在本文研究基礎(chǔ)上,結(jié)合大連市公安局“全文搜索系統(tǒng)”的實(shí)際課題,給出XML文檔分類的一個(gè)具體應(yīng)用。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-11
      頁(yè)數(shù): 60
      5人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:隨著社會(huì)信息化進(jìn)程的不斷深入,辦公軟件已經(jīng)成為人們?nèi)粘^k公不可缺少的基礎(chǔ)軟件之一。但自上世紀(jì)以來(lái),各個(gè)辦公軟件廠商大多采用封閉專有的文檔格式,這些標(biāo)準(zhǔn)不開(kāi)放,存在安全隱患,已經(jīng)無(wú)法滿足文檔組合、內(nèi)容提取、數(shù)據(jù)挖掘等新的工作環(huán)境的挑戰(zhàn)和新的應(yīng)用程序的需求。近幾年來(lái),隨著XML技術(shù)的不斷成熟,新的基于XML的開(kāi)放的文檔格式標(biāo)準(zhǔn)成為國(guó)際文檔格式的發(fā)展主流,不僅為用戶沖破法律上或者技術(shù)上的貿(mào)易壁壘提供保證,而且為簡(jiǎn)單快捷的實(shí)現(xiàn)文件和數(shù)據(jù)管理、數(shù)據(jù)恢復(fù)、數(shù)據(jù)挖掘以及與企業(yè)業(yè)務(wù)系統(tǒng)的數(shù)據(jù)交換提供了可能。本文從理論和應(yīng)用兩個(gè)角度出發(fā),以滿足這些新的需求和挑戰(zhàn)為目標(biāo),在對(duì)基于XML的開(kāi)放文檔格式深入研究的基礎(chǔ)上,為實(shí)現(xiàn)應(yīng)用程序與基于XML的開(kāi)放文檔格式的互操作建立一種低成本、高效率的解決方案。重點(diǎn)對(duì)當(dāng)前世界上三種主流的基于XML的開(kāi)放文檔格式之一,中文辦公軟件文檔格式開(kāi)發(fā)工具包的實(shí)現(xiàn)及實(shí)際應(yīng)用進(jìn)行了研究。在綜合分析研究了基于XML的開(kāi)放文檔格式的國(guó)內(nèi)外研究現(xiàn)狀和趨勢(shì)的基礎(chǔ)上,深入研究了UOF標(biāo)準(zhǔn)文檔格式定義,分析了UOF文檔格式的特點(diǎn);將以上分析研究作為理論前提,提出了適合于基于XML的開(kāi)放文檔格式的SCHEMA模式定義處理模型;并將其應(yīng)用于對(duì)UOFSCHEMA的處理,最終在JAVA平臺(tái)上實(shí)現(xiàn)了符合UOF標(biāo)準(zhǔn)的應(yīng)用開(kāi)放工具包UOFAPI,包括文字處理存取模塊、電子表格存取模塊、演示文稿存取模塊、格式與內(nèi)容分離模塊和壓縮打包模塊。UOFAPI使那些即使不懂UOF格式的程序員也能夠簡(jiǎn)單方便的操作UOF格式文檔,實(shí)現(xiàn)了企業(yè)業(yè)務(wù)系統(tǒng)與UOF格式文檔信息的集成。在應(yīng)用方面,本研究根據(jù)山東省研究生學(xué)位與研究生教育管理系統(tǒng)山東省研究生教育創(chuàng)新計(jì)劃重大項(xiàng)目,編號(hào)2006G01的具體需求,在對(duì)UOFAPI研究和改進(jìn)的基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于開(kāi)放文檔格式UOF的通用數(shù)據(jù)遷移系統(tǒng)。數(shù)據(jù)遷移模塊主要實(shí)現(xiàn)研究生系統(tǒng)業(yè)務(wù)數(shù)據(jù)的遷移,主要包括數(shù)據(jù)導(dǎo)入和導(dǎo)出,遷移過(guò)程采用JAVA反射技術(shù)實(shí)現(xiàn),以達(dá)到系統(tǒng)的通用性?;赨OF格式的數(shù)據(jù)遷移系統(tǒng)采用CS架構(gòu),具體的業(yè)務(wù)實(shí)現(xiàn)方法在SERVER端上實(shí)現(xiàn),CLIENT端只提供導(dǎo)入導(dǎo)出的圖形化界面,向SERVER傳遞導(dǎo)入導(dǎo)出命令來(lái)實(shí)現(xiàn)數(shù)據(jù)遷移?;赨OFAPI的數(shù)據(jù)遷移系統(tǒng)在研究生管理系統(tǒng)中的實(shí)際應(yīng)用驗(yàn)證了本文所提出的理論的可行性和UOFAPI的實(shí)用性。證明了UOFAPI在實(shí)現(xiàn)文檔資源與應(yīng)用程序的互操作方面的優(yōu)越性能,UOFAPI對(duì)提高應(yīng)用程序直接創(chuàng)建和操作UOF格式文檔的效率,具有十分重要的理論意義和應(yīng)用價(jià)值。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 74
      9人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:目前,伴隨著數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)倉(cāng)庫(kù)技術(shù)等的成熟和廣泛應(yīng)用,結(jié)構(gòu)化文檔管理問(wèn)題已經(jīng)基本得到解決;信息技術(shù)的廣泛應(yīng)用帶來(lái)非結(jié)構(gòu)化文檔激增,但對(duì)其應(yīng)用效率低下,而新興管理思想的涌現(xiàn)以及全球化競(jìng)爭(zhēng)的日益加劇迫切要求對(duì)組織中的非結(jié)構(gòu)化文檔資源進(jìn)行有效的管理。非結(jié)構(gòu)化文檔管理正日益成為互聯(lián)網(wǎng)時(shí)代信息資源管理的一個(gè)關(guān)鍵問(wèn)題。本文將語(yǔ)義WEB技術(shù)及標(biāo)準(zhǔn)引入非結(jié)構(gòu)化文檔的分析、標(biāo)記和應(yīng)用過(guò)程,以形成一套有效的非結(jié)構(gòu)化文檔管理方法,滿足企業(yè)應(yīng)用的迫切需求。本文首先系統(tǒng)介紹了語(yǔ)義WEB的相關(guān)理論,其中重點(diǎn)是語(yǔ)義WEB的三大關(guān)鍵技術(shù)XML、RDF及本體。之后圍繞非結(jié)構(gòu)化文檔管理生命周期的全過(guò)程獲取、標(biāo)記、組織存儲(chǔ)及應(yīng)用,分析了每個(gè)環(huán)節(jié)目前還存在的問(wèn)題。之后引入語(yǔ)義WEB技術(shù)進(jìn)行分析和解決,重點(diǎn)解決了1)文檔標(biāo)記中涉及到的標(biāo)記語(yǔ)言(外表特征和內(nèi)容特征兩方面)、標(biāo)記過(guò)程及標(biāo)記工具,并最終形成完整的結(jié)構(gòu)化的標(biāo)記描述,以利于計(jì)算機(jī)進(jìn)行理解和自動(dòng)處理;2)組織方法采用基于本體的組織方法代替?zhèn)鹘y(tǒng)線性組織方法,以滿足分布式的網(wǎng)絡(luò)信息組織的需要,同時(shí)存儲(chǔ)方式采取監(jiān)督機(jī)制來(lái)協(xié)同源文檔和標(biāo)記文檔之間的同步關(guān)系,以確保兩者同時(shí)更改和刪除;3)最后具體的應(yīng)用則從信息檢索、自動(dòng)分類、智能推理三個(gè)方向來(lái)分析信息檢索時(shí)利用本體進(jìn)行查詢擴(kuò)展,并根據(jù)語(yǔ)義相似度進(jìn)行檢索排序;自動(dòng)分類則以領(lǐng)域本體作為分類樹(shù),以形成動(dòng)態(tài)統(tǒng)一的分類標(biāo)準(zhǔn);智能推理方面則利用本體和描述邏輯來(lái)實(shí)現(xiàn)計(jì)算機(jī)理解的、規(guī)范化的描述,并利用描述邏輯的推理功能進(jìn)行智能推理。最后,在完成前面分析和解決問(wèn)題的基礎(chǔ)上,形成了完整的非結(jié)構(gòu)化文檔管理框架,詳細(xì)描述非結(jié)構(gòu)化文檔管理生命周期的全過(guò)程,并設(shè)計(jì)了一個(gè)企業(yè)郵件管理原型系統(tǒng),以驗(yàn)證研究的可行性和正確性。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 85
      17人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:B2C電子商務(wù)的迅猛發(fā)展,也暴露出一些問(wèn)題,例如由于信息的膨脹,客戶在從電子商務(wù)網(wǎng)站的搜索引擎或者其他專業(yè)的搜索引擎中搜索到需要的信息非常困難。客戶體驗(yàn)程度的降低肯定也會(huì)影響B(tài)2C電子商務(wù)的發(fā)展。作為WEB挖掘重要手段的WEB文檔聚類方法,能夠較好的解決這一問(wèn)題。本文主要是將WEB文檔聚類方法應(yīng)用于B2C電子商務(wù)中的途徑進(jìn)行了嘗試,給出了一個(gè)精簡(jiǎn)型的WEB文檔聚類系統(tǒng)實(shí)現(xiàn)框架,并對(duì)核心功能進(jìn)行了程序?qū)崿F(xiàn)。全文分以下三個(gè)部分討論首先,對(duì)B2C電子商務(wù)中WEB挖掘的需求,提出了基于WEB文檔聚類的頁(yè)面推薦和商品推薦兩個(gè)應(yīng)用結(jié)合點(diǎn)。其中頁(yè)面推薦又可基于提供方的不同分為電子商務(wù)站點(diǎn)搜索引擎應(yīng)用和公用搜索引擎應(yīng)用。然后,在分析兩種WEB挖掘系統(tǒng)實(shí)現(xiàn)框架的基礎(chǔ)上,提出了一個(gè)精簡(jiǎn)后的WEB文檔聚類系統(tǒng)實(shí)現(xiàn)框架,及其處理步驟。最后,分析了WEB文檔聚類系統(tǒng)具體實(shí)現(xiàn)過(guò)程中的三大關(guān)鍵技術(shù)WEB文檔的獲取,文本的表示和文本的聚類運(yùn)算。WEB文檔的獲取使用了元搜索引擎技術(shù)和自定義網(wǎng)絡(luò)蜘蛛技術(shù)。文本的表示使用了向量空間模型(VSM),在分析了VSM的優(yōu)點(diǎn)和不足以后,給出了其實(shí)施方法。文本的聚類使用了層次聚類的方法,其他基于矩陣的聚類方法的也可以很好的融合到系統(tǒng)中。討論了三大關(guān)鍵技術(shù)以后,給出了一個(gè)實(shí)驗(yàn)設(shè)計(jì)及其結(jié)果分析。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 65
      8人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:企業(yè)電子文檔屬于企業(yè)的重要資源,是企業(yè)核心競(jìng)爭(zhēng)力的具體表現(xiàn)形式。其主要包括企業(yè)的合同,項(xiàng)目文檔以及待發(fā)專利等。在激烈的知識(shí)競(jìng)爭(zhēng)中,由于核心電子文檔的泄露,導(dǎo)致企業(yè)的經(jīng)濟(jì)損失以及名譽(yù)損失,甚至關(guān)系企業(yè)的生死存亡,因此企業(yè)對(duì)電子文檔安全防護(hù)和管理的重視程度也越來(lái)越高。本文就企業(yè)如何防止核心電子文檔泄露進(jìn)行了研究,并指出其中比較容易被忽略的一環(huán)企業(yè)電子文檔形成過(guò)程之中產(chǎn)生的過(guò)程文檔。這些不同版本文檔廣泛存在于參與該文檔編寫(xiě)、整合、審核、修改、提交等操作過(guò)程的員工電腦上,涉及到的員工數(shù)量眾多,極易產(chǎn)生泄密隱患,也是現(xiàn)有企業(yè)文檔管理系統(tǒng)所忽略的問(wèn)題。針對(duì)上述過(guò)程文檔的檢測(cè)問(wèn)題,本文研究實(shí)現(xiàn)了一個(gè)企業(yè)電子文檔相似度快速檢測(cè)系統(tǒng)。該系統(tǒng)以COPS系統(tǒng)模型為藍(lán)本,采用文本塊分級(jí)匹配的思想,選取不同粒度文本塊的數(shù)字指紋進(jìn)行文檔相似度檢測(cè)。利用企業(yè)提供的核心文檔的預(yù)處理建立涉密文檔樣本庫(kù),而后通對(duì)相似度檢測(cè),將涉密過(guò)程文檔從員工電腦內(nèi)海量存儲(chǔ)的電子文檔中檢測(cè)出來(lái),提交給企業(yè)文檔管理系統(tǒng)進(jìn)行妥善處理,以達(dá)到縮小企業(yè)涉密電子文檔分布范圍的目的,進(jìn)而提高企業(yè)核心文檔的安全性。實(shí)驗(yàn)結(jié)果和企業(yè)反饋信息表明該系統(tǒng)具有較高的檢測(cè)速度和準(zhǔn)確率。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 54
      5人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:互聯(lián)網(wǎng)的蓬勃發(fā)展帶動(dòng)了信息檢索技術(shù)的不斷成熟,搜索引擎已經(jīng)成為每個(gè)人都離不開(kāi)的重要工具,人性化服務(wù)的時(shí)代背景也要求信息檢索技術(shù)向智能化發(fā)展。傳統(tǒng)的基于關(guān)鍵詞機(jī)械匹配的信息檢索方式已經(jīng)不能滿足科學(xué)研究和普通用戶的需求,因此基于語(yǔ)義的信息檢索成為當(dāng)前信息檢索研究的熱點(diǎn),通過(guò)自然語(yǔ)言語(yǔ)句進(jìn)行信息檢索已經(jīng)成為發(fā)展的趨勢(shì)。面對(duì)自然語(yǔ)言查詢語(yǔ)句,目前的檢索系統(tǒng)往往不能夠精確的理解用戶的查詢請(qǐng)求同時(shí),在檢索的過(guò)程中,現(xiàn)有的技術(shù)往往將文檔中的語(yǔ)義信息丟棄。在對(duì)現(xiàn)有的信息檢索模型的分析研究下,我們發(fā)現(xiàn)單純的查詢語(yǔ)句處理和主題模型檢索并不能滿足用戶對(duì)檢索結(jié)果準(zhǔn)確率越來(lái)越高的要求。分析現(xiàn)有的技術(shù)和研究成果,本文提出了一種基于雙層語(yǔ)義分析的文檔排序方法,分別通過(guò)查詢語(yǔ)句層次語(yǔ)義分析和文檔篇章層次語(yǔ)義分析,獲取信息檢索過(guò)程中所需的語(yǔ)義信息,從而提升搜索引擎性能。同時(shí)給出了基于雙層語(yǔ)義分析的全文檢索系統(tǒng)框架,該系統(tǒng)能夠在查詢語(yǔ)句層次上,對(duì)查詢語(yǔ)句進(jìn)行語(yǔ)義處理和復(fù)述在文檔篇章層次上,通過(guò)提取文檔中的潛在主題語(yǔ)義信息,用于優(yōu)化檢索結(jié)果。該方法通過(guò)結(jié)合查詢語(yǔ)句層次的語(yǔ)義信息和篇章層次語(yǔ)義信息,在向量空間模型的基礎(chǔ)上給出了基于雙層語(yǔ)義分析的文檔打分公式。根據(jù)提出的基于雙層語(yǔ)義分析的全文檢索系統(tǒng)框架,設(shè)計(jì)并實(shí)現(xiàn)了原型系統(tǒng),并解決在系統(tǒng)實(shí)現(xiàn)的中的問(wèn)題。通過(guò)對(duì)系統(tǒng)的實(shí)驗(yàn)結(jié)果進(jìn)行分析,驗(yàn)證了這種基于雙層語(yǔ)義分析的全文檢索方法的有效性。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-11
      頁(yè)數(shù): 53
      5人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:自然語(yǔ)言中普遍存在著同義詞和多義詞現(xiàn)象,致使人們很難通過(guò)以詞形匹配的關(guān)鍵詞檢索尋找到真正需要的網(wǎng)絡(luò)資源。潛在語(yǔ)義索引通過(guò)奇異值分解將同義詞映射到潛在語(yǔ)義空間的同一維度上,同時(shí)將多義詞映射到不同的維度上,進(jìn)而在一定程度上解決了一詞多義和多詞一義的現(xiàn)象。潛在語(yǔ)義索引與其它基于概念詞典的方法相比,具有可計(jì)算性強(qiáng),領(lǐng)域適應(yīng)能力強(qiáng)的優(yōu)點(diǎn),并已成為了自然語(yǔ)言處理領(lǐng)域中的研究熱點(diǎn)。本文的研究工作是通過(guò)強(qiáng)化合理的特征共現(xiàn)信息來(lái)提高潛在語(yǔ)義空間中特征向量和文檔向量的準(zhǔn)確度,進(jìn)而提高系統(tǒng)的性能?;谝陨系南敕?,本文提出了基于偽文檔的潛在語(yǔ)義索引的優(yōu)化框架,所謂偽文檔即是通過(guò)對(duì)原始文檔集合進(jìn)行有指導(dǎo)地組織而形成的新的文檔。同時(shí),本文在基于偽文檔的優(yōu)化框架的基礎(chǔ)上提出了兩種優(yōu)化策略基于語(yǔ)義塊的優(yōu)化方法及基于語(yǔ)義資源的優(yōu)化方法。針對(duì)潛在語(yǔ)義索引以文檔窗口為傳遞窗口造成的特征相關(guān)度不準(zhǔn)確的問(wèn)題,本文提出了基于語(yǔ)義塊的優(yōu)化方法。該方法是通過(guò)對(duì)原始文檔集合有指導(dǎo)地分割,將語(yǔ)義相近的特征劃分到同一個(gè)語(yǔ)義塊單元中,從而加強(qiáng)了語(yǔ)義相關(guān)特征的相關(guān)性,最終優(yōu)化了潛在語(yǔ)義空間中的代表特征和文檔的向量。同時(shí),在應(yīng)用潛在語(yǔ)義索引的過(guò)程中,生成潛在語(yǔ)義空間的整個(gè)過(guò)程是完全無(wú)指導(dǎo)的,使得語(yǔ)義空間中的表達(dá)特征和文檔的向量不夠準(zhǔn)確?;谡Z(yǔ)義資源的優(yōu)化方法通過(guò)將人的先驗(yàn)知識(shí)融入到原始的文檔集合中,有指導(dǎo)地強(qiáng)化了同義特征之間的相關(guān)度,最終使得潛在語(yǔ)義空間中表達(dá)特征和文檔的向量更加準(zhǔn)確。最終,本文開(kāi)發(fā)了“基于潛在語(yǔ)義索引的專利檢索系統(tǒng)”作為實(shí)驗(yàn)系統(tǒng),針對(duì)本文提出的方法以可視化的形式展示了實(shí)驗(yàn)效果。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-11
      頁(yè)數(shù): 56
      4人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:隨著互聯(lián)網(wǎng)和搜索引擎技術(shù)的發(fā)展普及,人們對(duì)于如何在龐大的互聯(lián)網(wǎng)上高效地獲得有價(jià)值的信息日益關(guān)注。文檔自動(dòng)摘要技術(shù)作為人們挑戰(zhàn)信息爆炸式增長(zhǎng)與信息有效利用之間矛盾的重要武器,受到世界的廣泛認(rèn)可。目前國(guó)際上許多學(xué)校和企業(yè)都在進(jìn)行文檔自動(dòng)摘要技術(shù)的研究,并取得一定成績(jī),也產(chǎn)生了各種各樣的自動(dòng)摘要應(yīng)用系統(tǒng)。但在我國(guó),文檔自動(dòng)摘要技術(shù)發(fā)展歷史比較短。我國(guó)文本摘要技術(shù)的發(fā)展研究還處于初級(jí)階段。國(guó)內(nèi)主要研究基于統(tǒng)計(jì)的方法,例如向量空間模型的摘要系統(tǒng)VECTSPACEMODEL。而基于語(yǔ)義的研究較少,一是由于語(yǔ)義對(duì)于語(yǔ)言學(xué)的研究要求較高,還有各種語(yǔ)料庫(kù)的建立,語(yǔ)義詞典的開(kāi)發(fā)相對(duì)國(guó)外比較落后,因此本文對(duì)于語(yǔ)義方面做單文檔摘要進(jìn)行研究。單文檔自動(dòng)摘要的目標(biāo)是在原始的文本中通過(guò)摘取,提煉主要信息,提供一篇簡(jiǎn)潔全面的摘要。已有的方法大都是通過(guò)統(tǒng)計(jì)和機(jī)器學(xué)習(xí)的技術(shù)從文本中直接提取出句子。本文主要研究基于語(yǔ)義的單文檔自動(dòng)摘要。首先研究了基于語(yǔ)義的詞語(yǔ)相似度計(jì)算和句子相似度計(jì)算。在此基礎(chǔ)上,提出了改進(jìn)型KMEDOIDS摘要系統(tǒng)和對(duì)稱非負(fù)矩陣分解的摘要系統(tǒng)。通過(guò)兩個(gè)系統(tǒng)與以往的系統(tǒng)進(jìn)行試驗(yàn)比對(duì),該方法提高了單文檔摘要的質(zhì)量。這說(shuō)明基于語(yǔ)義的摘要方法有一定的效果,值得今后進(jìn)一步地研究。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 71
      12人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:隨著計(jì)算機(jī)與網(wǎng)絡(luò)的普及應(yīng)用,數(shù)據(jù)信息安全問(wèn)題成為了人們關(guān)注的重點(diǎn)。而移動(dòng)存儲(chǔ)介質(zhì)是傳遞信息數(shù)據(jù)的重要平臺(tái),主要包括U盤、移動(dòng)硬盤等。其能給信息交換和傳遞帶來(lái)極大的便捷,但是與此同時(shí)也帶來(lái)了巨大的安全隱患。當(dāng)前數(shù)據(jù)信息安全問(wèn)題不單只來(lái)自于外界的攻擊,還存在部分來(lái)自于內(nèi)部的泄密,因此為了防止U盤數(shù)據(jù)泄露,設(shè)計(jì)實(shí)現(xiàn)針對(duì)U盤的文檔保護(hù)系統(tǒng)十分有必要。本文所設(shè)計(jì)實(shí)現(xiàn)的就是一種基于WINDOWS平臺(tái)的U盤文檔保護(hù)系統(tǒng)。本文首先從相關(guān)技術(shù)分析入手,為本文所研究設(shè)計(jì)的系統(tǒng)提供了技術(shù)支持。文章論述了基于WINDOWS平臺(tái)的U盤文檔保護(hù)系統(tǒng)的功能需求,包括U盤監(jiān)控服務(wù)以及文檔透明管理。然后,文章就U盤文檔保護(hù)系統(tǒng)系統(tǒng)設(shè)計(jì)展開(kāi)了論述。使用USB設(shè)備監(jiān)控技術(shù)和文檔保護(hù)過(guò)濾技術(shù)實(shí)現(xiàn)了U盤監(jiān)控服務(wù)和文檔透明加解密服務(wù)。文章最后對(duì)U盤文檔保護(hù)系統(tǒng)進(jìn)行了功能測(cè)試和性能測(cè)試。主要測(cè)試了系統(tǒng)的U盤實(shí)時(shí)動(dòng)態(tài)監(jiān)控功能和文檔透明加解密功能。文章還總結(jié)出系統(tǒng)的優(yōu)勢(shì)與不足,并且對(duì)日后研究的重點(diǎn)與方向進(jìn)行展望。該系統(tǒng)的優(yōu)勢(shì)在于對(duì)文檔進(jìn)行加解密的是通過(guò)透明加解密的方式。透明加解密技術(shù)主要由用戶模式的用戶控制程序與內(nèi)核模式的文件過(guò)濾驅(qū)動(dòng)組成。其主要實(shí)現(xiàn)的功能為接受用戶控制模式的命令,根據(jù)加密的規(guī)則對(duì)相應(yīng)的文件進(jìn)行透明加解密處理。用戶在使用過(guò)程中無(wú)法得知保護(hù)文件經(jīng)過(guò)了加解密處理。本系統(tǒng)在一定程度上實(shí)現(xiàn)了U盤文檔的安全保護(hù)管理,保證了文檔的保密性與安全性。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 81
      10人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:二值文檔圖像作為二值圖像與文檔圖像的交集,是二值圖像的主體,在傳真、電子政務(wù)、數(shù)字圖書(shū)館建設(shè)和網(wǎng)上閱卷等領(lǐng)域中都有廣泛的應(yīng)用,而且灰度文檔圖像也可以通過(guò)位平面分解的方法轉(zhuǎn)化為二值文檔圖像,面對(duì)圖像數(shù)據(jù)量巨大的特點(diǎn),對(duì)二值文檔圖像壓縮進(jìn)行研究,不僅可以減少圖像存儲(chǔ)空間以及由此產(chǎn)生的成本,同時(shí)可以降低系統(tǒng)的訪問(wèn)、處理以及傳輸帶寬負(fù)擔(dān),因此有必要對(duì)二值文檔圖像壓縮進(jìn)行研究。本文主要研究成果主要包括以下兩個(gè)方面1對(duì)版面分析進(jìn)行了深入研究,并對(duì)其中的關(guān)鍵技術(shù)進(jìn)行了創(chuàng)新。版面分析是二值文檔圖像壓縮中非常重要的一個(gè)步驟,通過(guò)對(duì)文檔圖像中各區(qū)域進(jìn)行分類,可以有效提高文檔圖像的壓縮比。本文對(duì)版面分析中的關(guān)鍵技術(shù)進(jìn)行了研究創(chuàng)新,并進(jìn)行了MATLAB仿真驗(yàn)證,包括對(duì)常用的二值化方法OTSU結(jié)合局部閾值思想提出了一種新的方法MOTSU方法;針對(duì)HOUGH變換中難以同時(shí)兼顧精確度和速度的問(wèn)題,提出了一種新的傾斜角度檢測(cè)方法,該方法可以有效提高傾斜角度檢測(cè)的速度與精度;并采用數(shù)學(xué)形態(tài)學(xué)方法對(duì)去噪和版面分解進(jìn)行了研究及實(shí)現(xiàn)。2對(duì)熵編碼進(jìn)行了改進(jìn),并實(shí)現(xiàn)了二值文檔圖像的變換編碼,將變換編碼思想成功引入二值文檔圖像壓縮中。本文對(duì)熵編碼方法進(jìn)行了改進(jìn),提出了一種基于分層策略的熵編碼方法,即首先通過(guò)收縮原始圖像獲取縮略圖,以及與縮略圖中前景像素相應(yīng)的組合圖像,然后再進(jìn)行熵編碼處理,通過(guò)這種方法可以減少文檔圖像中的游程種類數(shù)目。本文的另一項(xiàng)創(chuàng)新是實(shí)現(xiàn)了二值文檔圖像的變換編碼,首先本文利用二值小波變換給出了一種簡(jiǎn)單的濾波器設(shè)計(jì)方法,并給出了濾波器的快速算法,進(jìn)行了二值文檔圖像二值小波變換的多分辨率分解和重構(gòu),并且通過(guò)實(shí)驗(yàn)我們可以看到經(jīng)過(guò)二值小波變換后圖像冗余統(tǒng)計(jì)信息減少,即在壓縮時(shí)可以用更少的比特位表示圖像。最終結(jié)合改進(jìn)的熵編碼方法實(shí)現(xiàn)了將變換編碼方法引入二值文檔圖像的壓縮,拓展了二值文檔圖像壓縮可用方法的范圍。
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 78
      7人已閱讀
      ( 4 星級(jí))
    • 簡(jiǎn)介:在企業(yè)級(jí)分布式應(yīng)用系統(tǒng)的多層體系結(jié)構(gòu)中中間業(yè)務(wù)邏輯層是整個(gè)系統(tǒng)的關(guān)鍵組成部分它負(fù)責(zé)實(shí)現(xiàn)企業(yè)的主要業(yè)務(wù)流程然而實(shí)現(xiàn)業(yè)務(wù)邏輯層關(guān)鍵在于如何保證業(yè)務(wù)信息無(wú)阻礙、可路由和端對(duì)端安全的傳輸首先信息要在傳輸過(guò)程中能夠穿越各種防火墻的阻攔其次通過(guò)動(dòng)態(tài)制定傳輸路徑的方式來(lái)保證信息必須經(jīng)過(guò)當(dāng)次業(yè)務(wù)流程的中間節(jié)點(diǎn)最后必須保證重要數(shù)據(jù)從起點(diǎn)到終點(diǎn)整個(gè)過(guò)程中的保密性和完整性本文正是在這樣的背景下展開(kāi)工作的在遼河油田油井施工設(shè)計(jì)系統(tǒng)的開(kāi)發(fā)過(guò)程中用戶要求施工設(shè)計(jì)文檔的審核審批流程采用分布式體系結(jié)構(gòu)實(shí)現(xiàn)對(duì)系統(tǒng)的分析表明在審核審批流程中信息需要穿越各種防火墻油井設(shè)計(jì)文檔以WD文檔的形式存取設(shè)計(jì)文檔必須依次通過(guò)代表一審、二審、三審和審批人員的中間節(jié)點(diǎn)由于信息的重要性必須對(duì)信息采取相應(yīng)的安全保護(hù)措施最終我們決定采用WEBSERVICE作為網(wǎng)絡(luò)上信息傳輸?shù)姆椒ㄖ宰龀鲞@樣的選擇有以下幾個(gè)原因第一WEBSERVICE的首選協(xié)議SOAP簡(jiǎn)單對(duì)象存取協(xié)議大多數(shù)情況下是基于HTTP協(xié)議的所以SOAP消息能夠穿透各種防火墻第二SOAP的掛載擴(kuò)展規(guī)范WSATTACHMENTS和DIME直接INTER消息封裝說(shuō)明了SOAP消息如何掛載二進(jìn)制附件第三SOAP的路由擴(kuò)展規(guī)WSADDRESSING為制定SOAP消息的傳輸路徑提供了有力支持第四SOAP的安全擴(kuò)展規(guī)WSSECURITY使保護(hù)SOAP消息中重要信息變?yōu)榭赡鼙疚囊栽O(shè)計(jì)文檔的審核審批流程為主要線索提出能滿足消息路由、安全、處理及掛載等方面要求的SOAP消息模型并基于此消息模型建立一個(gè)消息傳輸框架來(lái)模擬審核審批流程最終設(shè)計(jì)并實(shí)現(xiàn)遼河油田油井施工設(shè)計(jì)文檔審核審批子系統(tǒng)結(jié)果表明與通常采用的BS結(jié)構(gòu)相比系統(tǒng)采用的中間節(jié)點(diǎn)型路由模型通過(guò)增加較少的本地處理代價(jià)來(lái)減少網(wǎng)絡(luò)應(yīng)答代價(jià)并且使系統(tǒng)具有比較好的安全性和可靠性適用于以安全性和可靠性為目標(biāo)的分布式應(yīng)用系統(tǒng)業(yè)務(wù)邏輯層的實(shí)現(xiàn)
      下載積分: 5 賞幣
      上傳時(shí)間:2024-03-10
      頁(yè)數(shù): 71
      13人已閱讀
      ( 4 星級(jí))
    • 下載積分: 5 賞幣
      上傳時(shí)間:2024-03-09
      頁(yè)數(shù): 60
      4人已閱讀
      ( 4 星級(jí))
    關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服客服 - 聯(lián)系我們

    機(jī)械圖紙?jiān)创a,實(shí)習(xí)報(bào)告等文檔下載

    備案號(hào):浙ICP備20018660號(hào)