版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、三大功能:三大功能:對未來數字化古籍的期待未來數字化古籍的期待王兆鵬王兆鵬中文古籍的數字化,近幾年發(fā)展迅猛,種類之多,數量之大,功能之強,都出乎我們的意料。古籍的數字化,不僅可以給我們提供強大的檢索功能,還可以幫助我們發(fā)現問題。數字化古籍,怎么能夠發(fā)現問題呢?我舉兩個例子。一是《全宋詞》中,有許多互見詞,也就是一首詞被收錄在不同作者名下,由于史料的缺乏,有的難以判斷這些互見詞的真正作者。為慎重起見,我的老師唐圭璋先生在編《全宋詞》時,根
2、據相關文獻,把這些互見的同一首詞編列于不同作者的名下。唐先生生前,曾經耗費大量的精力,做過《宋詞互見考》,能斷是非的就作判斷,不能斷是非的就存疑。我原以為唐先生已經將這一工作窮盡了。前幾年一次偶然的機會,卻發(fā)現《全宋詞》中還有些互見詞,老師并未發(fā)現。那是我要統(tǒng)計《全宋詞》中相互唱和的詞作,請一個朋友幫我設計一個軟件,將《全宋詞》中用韻相同或相近的詞作全部列出目錄。他用了四個小時,在《全宋詞》數據庫里加寫了一個程序,經計算機自動運算處理,
3、最終用Excel幫我列出了我所需要的相關資料和數據。如果讓我手工在計算機上查詢2萬多首詞哪些是屬于唱和次韻之作,恐怕沒有一年半載的時間難以做到,他卻只花了一個晚上的時間就幫我搞定了。這使我相信,古籍的數字化,只有我們想不到的,沒有做不到的。我們利用古籍做研究的人,需要數字化古籍庫提供什么功能,都應該可以解決。我在統(tǒng)計結果時,意外地發(fā)現,有許多用韻完全相同的詞,有的屬于同一首詞,而見于不同作者名下,即屬互見詞。其中不少互見詞,我的老師沒能
4、發(fā)現。這并不是我比老師高明,而是電腦可以窮盡式地處理資料數據,而手工和記憶,畢竟會有遺漏。不是這個數據庫,我既不可能準確地統(tǒng)計出《全宋詞》中唱和詞的情況,也無法發(fā)現《全宋詞》中還有一些互見詞有待考定。這是數字化古籍幫我發(fā)現的第一個問題。第二個問題是,前年我做《全明詞》和《全清詞》研究。由于明清之際的詞人,時代的劃分不易處理,屬明屬清,都有道理。于是,有的詞人,這兩本書都予收錄。為了弄清楚這兩本書究竟收錄了哪些共同的詞人和詞作,我讓門下研
5、究生做了一個數據庫,將這兩本書所收錄的詞人、詞作和收錄的來源文獻,用Excel做了一個表格。結果意外地發(fā)現,同一位詞人,兩本書收錄的作品數量、篇目并不一樣,有的甚至相差二、三百篇。這主要是因為兩本書依據的文獻不一樣。利用這個數據庫,我寫了一系列的《全明詞》和《全清詞》的研究論文,其中發(fā)現并指出了《全清詞》應收而未收的詞作有1600首之多。如果用人工比對,而不用數據庫處理,花的時間多不己的需要,增加相關條件后,就可以動態(tài)地智能化地檢索。二
6、、自動化的統(tǒng)計功能二、自動化的統(tǒng)計功能定量分析,今后可能是古代文學研究中常用的一種手段和方法。定量分析,需要大量的統(tǒng)計數據。如果數字化古籍能實現這個功能,那就更為便利。比如,我想在《國學寶典》里統(tǒng)計歷代評論李白和杜甫的數據,從一個角度比較說明,歷史上是李白更受推崇還是杜甫更受尊敬?目前的《國學寶典》,我不知道能不能做到。因為,在《國學寶典》里,即使我們從不同的角度用不同的組合方式查到所有李白和杜甫的資料,但《國學寶典》不能自動識別哪些是
7、評論資料,哪些是記載生平的歷史資料,更無法識別資料中對李杜的評價是褒還是貶,是揚還是抑。所以無法自動統(tǒng)計和生成我們所需要的評論數據。再比如,我想統(tǒng)計唐詩在歷代文獻中入選和被稱引或被評點的資料。這個數據,也比較復雜。原因是,有些詩歌,在題下署了作者的名字,有的沒署。沒署名怎么自動識別是哪位作者的?即使署了名,有的署名,有的署字,有的署別號,又怎樣自動識別哪些名、字、號是同一位詩人?有的僅征引了詩中的一句或幾句,又怎樣自動識別這幾句是哪位詩
8、人的哪一首詩?體裁上,怎樣自動識別是古體還是近體,是七律還是五律?我目前做的唐詩數據庫,是將歷代唐詩選本一一錄入,設置一些項目,如詩題、作者、文獻來源、體裁等等。然后再分類統(tǒng)計。有沒有可能,利用現有的大型數字化古籍,加上一些識別的條件,讓它自動識別和生成我所需要的數據呢?技術上也許是可能的。我的這個數據庫,目前只含近百種古今唐詩選本,遠遠沒有窮盡古今所有的唐詩選本,更沒有包含類書和相關典籍諸如詩話、筆記、別集、小說中的唐詩資料。數字化古
9、籍,統(tǒng)計字頻比較容易,《國學》網上已公布了《國學寶典》中單字字頻的數據。雖然詞頻統(tǒng)計相對復雜和困難,但已經獲得了解決。如果能夠根據研究者不同的需要,數字化古籍能自動統(tǒng)計各種數據,那該多么令人神往!三、多元化的對比功能三、多元化的對比功能有比較才有鑒別,有比較才有發(fā)現??茖W研究是從發(fā)現問題開始的。數字化古籍的對比功能,用于古籍整理和研究最有優(yōu)勢。數字化古籍可進行哪些項目的對比呢?1版本對比在超大型數字化古籍庫中,可以考慮同時收錄同一古籍文
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 古籍數字化的保真原則
- 淺議古籍數字化建設
- 古籍數字化課程閱讀材料
- 農業(yè)古籍數字化整理研究.pdf
- 數字化過程中的古籍保護問題
- 免疫的三大功能
- 古籍數字化對學術的影響及其發(fā)展方向
- 10819.廣西地區(qū)特色古籍資源數字化研究
- 10級古典文獻專業(yè)古籍數字化復習要點
- 數字化中醫(yī)古籍的理想模式及其相關問題研究.pdf
- 古籍文獻數字化學科建設探究
- 六重自我數字化未來的衍生物
- 未來數字化家庭餐廚空間的初探.pdf
- 大功率脈沖電解電源的數字化設計.pdf
- 淺析檔案管理數字化的現狀與未來發(fā)展
- 多功能數字化胃腸講訴
- 數字化網絡時代酒店如何把握商業(yè)未來
- 淺析檔案管理數字化的現狀與未來發(fā)展
- 全數字化三相大功率逆變器及并聯運行.pdf
- 數字化論文數字化設計論文
評論
0/150
提交評論