2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、語言文字信息處理教程第一章、概論,盛玉麒山東大學中文信息研究所,第一節(jié)、信息與信息處理,(一)什么是信息(二)信息的基本屬性(三)什么是信息處理(四)語言文字的信息屬性(五)語言文字信息處理的特點,(一)什么是信息,信息是20世紀人類最偉大的發(fā)現(xiàn)之一。對信息屬性與功能的開發(fā)和利用成為“信息化社會”的基本生產方式和重要的支柱產業(yè)。信息的屬性可以從不同的角度來認知和歸納。信息是關于事物運動的狀態(tài)和方式的廣義知識。信息是與物

2、質、能量并列的世界組成的三大要素。,(一)信息的基本屬性,1、客觀性2、符號性3、可轉換性4、可復制性5、可傳遞性6、可共享性,1、客觀性,信息是客觀事物存在的方式和狀態(tài)的總和以及人們對客觀存在的認識。無論是從信息來源看還是從人們對信息的認知路線與描述方式看,都需要以客觀存在為基礎,以事物的本質屬性與客觀實踐為判斷標準。真實反映與正確描述客觀事物的本質屬性才是有價值的信息。,2、符號性,信息既不是物質、也不是能量,而是關于

3、物質和能量的存在狀態(tài)與方式,即關于物質和能量的屬性的符號。,3、可轉換性,同一信息可采用不同的載體和表現(xiàn)形式。不同載體形式之間可以進行轉換。同一個語義信息既可以用實物表達、也可用手勢、形體或語言的形式;既可以用文字、圖像,也可以用聲音、動畫,各種形式都可以轉換為數(shù)碼符號。多種表現(xiàn)形式和多種載體類型都屬于廣義的符號范疇。,4、可復制性,信息可以無限制地復制,復制后的結果和原型之間無論從形式、結構還是功能等方面看都毫無二致。,5、

4、可傳遞性,信息可以在時間和空間的范圍內進行傳遞。在空間范圍中的傳遞是“通信”、在時間上的傳遞就是“記憶”。,6、共享性,因為具有了上述基本屬性,人們可以通過對信息的采集和控制,實現(xiàn)對客觀物質和能量的了解與控制;通過對信息的加工與處理實現(xiàn)對物質的改造與優(yōu)化。因此,就使得信息具有了“間接資源”或“無形資源”的共享性特點。,(三)什么是信息處理,1、信息的采集2、信息的存儲3、信息的加工4、信息的傳遞5、信息科學的產生,1、信

5、息的采集,文字圖形音頻視頻數(shù)據,2、信息的存儲,1、存儲形式:原型加工2、存儲介質磁介質光介質,3、信息的加工,修改分類排序比較查詢檢索統(tǒng)計分析特征抽取,4、信息的傳遞,人——機——人系統(tǒng)機——人——機系統(tǒng)機——機——機系統(tǒng)方式:串行并行,5、信息科學的誕生,1948年,美國數(shù)學家申農發(fā)表《通信的數(shù)學理論》標志著信息論的創(chuàng)立。信息論發(fā)展的三個時期:1、20世紀50年代,新創(chuàng)立的信息論向各個學科

6、的沖擊。2、20世紀60年代,劃分出狹義信息論、一般信息論、廣義信息論。3、20世紀70年代形成信息科學。4、信息科學是與電子學、計算機、自動化技術、生物學、心理學、管理學相互聯(lián)系而形成的綜合性科學,語言文字自的信息屬性,邏輯思維的符號認知交際的媒介智力開發(fā)的工具科技發(fā)展的基礎文化傳承的載體信息處理的重點民族心理的寄托國家主權的象征,屬性1:邏輯思維的符號,馬克思說過,語言是思想的直接現(xiàn)實。人類的邏輯思維離不開語言

7、,人類社會離不開語言。如果沒有語言,就不成其為人類社會。,屬性2:認知交流的媒介,語言哲學家認為,語言是人類認識世界的中介。人們只有憑借語言才能了解世界,也只有通過語言才能描述對世界的認識,從而使別人了解自己。如果沒有語言,思想、認識和經驗等都失去了媒介。,屬性3:智力開發(fā)的工具,語言是和智能活動聯(lián)系在一起的。語言能力的獲得是人類進化的關鍵一步。智力和素質在很大程度上表現(xiàn)為語言思維和表達上。毛澤東說過,感覺到的東西不能很好的

8、認識,只有理解了的東西才能更深刻地認識。只有首先獲得語言能力,才有可能進一步開發(fā)大腦的智力。語言能力差而具有較高智商的人是很少見的。,屬性4:科教發(fā)展的基礎,科技和教育是人類社會進步和發(fā)展的動力。其基礎即要依靠語言文字的記錄、表達和傳遞。無論多么先進的理論、或者科學技術,都必須獲得正確的記錄和表達,才能被更多的人學會和掌握,與更多的人共享。,屬性5:文化傳承的載體,語言文字又是文化的載體,由于有了語言文字的記錄,歷史才能夠得以傳

9、承和延續(xù)。也由于有了語言文字的記錄,民族特色的文化精華才能在共時的空間中廣泛地傳播。,屬性6:信息處理的重點,在多媒體信息網絡時代,在圖、文、聲、像等所有的信息媒體中,語言文字仍是信息處理的重點。我們社會和生活中絕大多數(shù)信息都是以語言文字的形式出現(xiàn)的??梢哉f,進入信息時代的根本標志就是語言文字信息的數(shù)字化。,屬性7:民族心理的寄托,語言是民族的重要構成部分。作為民族特征和標志的語言文字在長期的使用過程中,被賦予了豐富而深厚的內涵

10、,成為民族心理的寄托。所謂“他鄉(xiāng)遇故知”、“鄉(xiāng)音無限情”、“母語情結”等等,都是古今共同的感情表達。,屬性8:國家主權的標志,都德的《最后一課》為什么打動了億萬人的心,就是因為他寫出了一個國家和民族的語言“情結”。任何一個主權國家都有自己法定的語言文字。所有的外交官不管外語多好,在外交場合也要使用自己國家的語言講話,因為這涉及到一個主權國家的獨立和尊嚴。,(五)語言文字信息處理的特點,西文1、字母文字2、小字符集3、鍵盤基礎

11、4、分詞5、硬件原創(chuàng)6、軟件原創(chuàng),中文1、圖形文字2、大字符集3、沒有鍵盤基礎4、不分詞5、硬件引進6、軟件漢化,(五)語言文字信息處理的理論思考,1、重要的信息載體2、不是唯一的載體3、語義信息的多維性4、語言編碼的多重性,1、信息載體,語言是載負信息的符號系統(tǒng)。著名語言學家Saussure指出,語言是一種社會慣例,是表達概念的符號系統(tǒng)。從音義結合的關系上看,語言是音義結合的符號系統(tǒng)。“語言是人類社會最

12、重要的交際符號系統(tǒng)”。人與人之間交際的本質就是進行信息的交流和交換,,2、語言不是唯一的信息載體,語言信息的載體并不僅僅限于語音。除了語音之外,表情、手勢、姿勢、環(huán)境、相互關系、話題等等都能夠參與交際、起到信息載體的功能。這些非聲音手段的參與就使得語言的交流和交際表現(xiàn)出多信道的特點。,3、語義信息的多維性,(1)語言能力是人的一般認知能力的一部分,因此語言不是一個自足的系統(tǒng),其描寫和理解都必須參照認知過程;(2)語言結構與人類的概

13、念知識、實踐經驗以及話語的功能有關,并以它們?yōu)槔頁?4、語言編碼的多重性,實物代碼語音代碼文字代碼副語言代碼,實物代碼,從信息傳遞和處理的角度看,所有的實物都可以傳遞信息。即使是現(xiàn)代人在現(xiàn)實生活中也經常使用這些非語言代碼方式進行相互間的信息溝通。即使在正常人群的交往和交際過程中實物充當了十分重要的腳色;教學使用的圖畫、教具、實物等幫助學生加強對知識的理解。,語音代碼,語音是有聲語言的重要代碼系統(tǒng)。采用語音作代碼有很多好處

14、:成本低、干擾少、可控性強、區(qū)別性特征靈活多樣,等等。語音代碼的基本單位是音節(jié)。作為“語言”的基本單位都是“音義結合體” 。語言系統(tǒng)中意義的最小單位就是語素。任何語言中的語素幾乎沒有小于一個音節(jié)的。,文字代碼,文字是最重要的輔助語言交際的書寫符號系統(tǒng)。文字的最大功能是將聽覺符號的代碼系統(tǒng)轉換為視覺符號的代碼系統(tǒng)。突破了有聲語言在“時間”與“空間”上的局限性,可以使語言信息傳遞得更加久遠。一切成熟的文字代碼幾乎都是與語音代碼

15、具有同等的效能。,副語言代碼,“副語言代碼”形式諸如手勢、姿勢、動作、表情等等許多非語音的成分。這些非語音成分也同樣具有載負信息的功能,同樣能夠表情達意,因此,被稱為“形體語言”。有研究表明,在人們的生活中,副語言信息代碼所傳遞的信息占一個人所獲得的全部外界信息的80%以上。,語義是一種特別的符號關系,薩丕爾認為,語義是“一種特別的符號關系”。對語義信息的習得、傳遞、表達和交流,就是建立、描述、理解和確定各種“符號關系”。薩丕爾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論