版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、漢語構(gòu)詞是漢語語言學(xué)的重要領(lǐng)域。針對漢語詞的內(nèi)部結(jié)構(gòu)及相關(guān)的構(gòu)詞現(xiàn)象,已經(jīng)進(jìn)行了為數(shù)眾多的研究,并積累了豐富的認(rèn)識。漢語構(gòu)詞研究的傳統(tǒng)路向往往將研究視野限定在單個(gè)的漢語詞,容易忽視漢語詞所處的真實(shí)語境,對于定量方法的重視程度也有待提高。這些因素使得漢語構(gòu)詞研究難以考察與語言真實(shí)使用密切相關(guān)的構(gòu)詞現(xiàn)象,尤其是漢語詞在語言真實(shí)使用當(dāng)中的形成機(jī)制和相關(guān)的構(gòu)詞屬性。本研究嘗試了一種基于真實(shí)語料并采用定量方法的漢語構(gòu)詞研究新路向。新路向是一種基于
2、使用的漢語構(gòu)詞研究路向,作為其研究對象的詞是在漢語真實(shí)語境當(dāng)中使用著的詞。由于字是漢語真實(shí)語境中能夠被直接觀察的唯一語言單位,新路向?qū)⑵渥鳛闃?gòu)詞的基本單位,而詞被視為字在語言真實(shí)使用中形成的固定序列。新路向充分尊重漢語詞作為隱含在表現(xiàn)為連續(xù)字流的真實(shí)語境之下的語言單位的事實(shí)。除了在真實(shí)語境中考察單個(gè)的詞之外,新路向也將研究視野拓展到了缺乏詞邊界的整個(gè)漢語語境。這種經(jīng)過拓展的研究視野有助于探索漢語詞在語言真實(shí)使用中的形成機(jī)制和相關(guān)構(gòu)詞屬性
3、。同時(shí),新路向選擇比較簡單并且符合人類認(rèn)知規(guī)律的計(jì)量指標(biāo),以便讓研究結(jié)果在語言認(rèn)知方面具有說服力。
本研究采用這種新路向試圖解決三個(gè)問題。(1)真實(shí)語境中的字-字同現(xiàn)關(guān)系的統(tǒng)計(jì)特征如何反映字的自由/粘著性和定位性?(2)不同的字具有怎樣的構(gòu)詞能產(chǎn)性定量特征,其與字-字同現(xiàn)關(guān)系的統(tǒng)計(jì)特征之間有何聯(lián)系?(3)字-字同現(xiàn)關(guān)系的統(tǒng)計(jì)特征如何反映二字詞在真實(shí)語境中的形成機(jī)制?
本研究以語言復(fù)雜網(wǎng)絡(luò)的模型和指標(biāo)為主,計(jì)量語言學(xué)的
4、傳統(tǒng)方法為輔來解答第一個(gè)研究問題。一方面,基于結(jié)合面寬窄的思想,提出了同現(xiàn)字豐富程度的概念。給定字的同現(xiàn)字豐富程度越高,其結(jié)合面就越寬。基于漢語真實(shí)語料,將給定字及其與其他字形成的同現(xiàn)關(guān)系構(gòu)建為有向有權(quán)的字同現(xiàn)網(wǎng)絡(luò),采用平均n次累積出/入度/熵的指標(biāo)來測量給定字單側(cè)的同現(xiàn)字豐富程度。從概率配價(jià)的角度而言,這類計(jì)量指標(biāo)反映的是給定字形成字-字同現(xiàn)關(guān)系的效率。另一方面,通過計(jì)量語言學(xué)的傳統(tǒng)方法,對給定字單側(cè)的同現(xiàn)字的類符總數(shù)和熵的增長趨勢進(jìn)
5、行了非線性擬合,并基于擬合曲線的計(jì)量特征來反映字在單側(cè)的同現(xiàn)字豐富程度。
結(jié)果表明,字的同現(xiàn)字豐富程度能夠在較大程度上反映出字的自由/粘著性和定位性。給定字單側(cè)的同現(xiàn)字豐富程度與其在同側(cè)的構(gòu)詞概率呈現(xiàn)顯著的負(fù)相關(guān)。單側(cè)同現(xiàn)字豐富程度越高,給定字就越不傾向于與同側(cè)的同現(xiàn)字構(gòu)詞(或者說在該側(cè)的自由性趨勢越強(qiáng));反之,給定字就越傾向于與同側(cè)的同現(xiàn)字構(gòu)詞(或者說在該側(cè)的粘著性趨勢越強(qiáng))。給定字與其單側(cè)頻數(shù)最高的同現(xiàn)字往往是要構(gòu)詞的。這
6、一趨勢對于單側(cè)同現(xiàn)字豐富程度較低的字尤其明顯。給定字單側(cè)的同現(xiàn)字豐富程度與其在同側(cè)的構(gòu)詞偏好也呈現(xiàn)顯著的負(fù)相關(guān)。給定字兩側(cè)的同現(xiàn)字豐富程度的差異能夠大致反映其定位性。統(tǒng)計(jì)結(jié)果顯示,常用字在右側(cè)的同現(xiàn)字豐富程度的總體水平要顯著低于左側(cè),表明這些字可能更容易與右側(cè)的字形成詞或者短語。字的整體同現(xiàn)字豐富程度能大致反映字的整體自由/粘著性。整體同現(xiàn)字豐富程度最高的字往往具有語法化趨勢,其中也包括了用作單字虛詞的字。這些單字虛詞在真實(shí)語境中是重要
7、的分詞符,其對應(yīng)字的高水平的同現(xiàn)字豐富程度反映著這些詞在真實(shí)語境中的形成機(jī)制。非線性擬合結(jié)果表明,字單側(cè)的同現(xiàn)字類符數(shù)和熵的增長趨勢在較大程度上可以用適宜的曲線方程進(jìn)行描寫。方程的計(jì)量特征也能大致反映字在單側(cè)的同現(xiàn)字豐富程度,以及字在同側(cè)的自由/粘著性。然而,非線性擬合的方法的適用性不及基于平均n次累計(jì)度/熵的方法。
解答第二個(gè)研究問題,首先需要進(jìn)一步明確構(gòu)詞能產(chǎn)性的本質(zhì),并區(qū)分不同的構(gòu)詞能產(chǎn)性計(jì)量指標(biāo)的意義。構(gòu)詞能產(chǎn)性被區(qū)分
8、為過往和當(dāng)前構(gòu)詞能產(chǎn)性兩大類。前者是指在當(dāng)前的共時(shí)階段之前的構(gòu)詞能產(chǎn)性,而后者是指當(dāng)前共時(shí)階段的構(gòu)詞能產(chǎn)性,能預(yù)測未來產(chǎn)生新詞的能力。
從同現(xiàn)字豐富程度的不同水平段抽取了部分字,并考察了其過往和當(dāng)前構(gòu)詞能產(chǎn)性的計(jì)量特征。結(jié)果表明,字的過往構(gòu)詞能產(chǎn)性與同現(xiàn)字豐富程度之間存在一定的關(guān)系。從概率配價(jià)的角度來看,這種關(guān)系反映著字形成字-字同現(xiàn)關(guān)系的效率與構(gòu)詞能力之間的關(guān)系。對于同現(xiàn)字豐富程度極高和極低的字,其過往構(gòu)詞能產(chǎn)性一般都是極低
9、的。具有高水平的過往構(gòu)詞能產(chǎn)性的字,其同現(xiàn)字豐富程度應(yīng)該處于適中的水平。非線性擬合的結(jié)果顯示,字構(gòu)詞的類符總數(shù)的增長趨勢可以在較大程度上使用適宜的曲線方程進(jìn)行描述。曲線的統(tǒng)計(jì)特征能夠大致反映給定字的當(dāng)前構(gòu)詞能產(chǎn)性。然而,非線性擬合的方法的適用性不及基于一頻次詞的構(gòu)詞能產(chǎn)性指標(biāo)。另外,字構(gòu)詞的豐富程度也能反映其當(dāng)前構(gòu)詞能產(chǎn)性。字的過往和當(dāng)前構(gòu)詞能產(chǎn)性之間具有明顯的正相關(guān)性。字在當(dāng)前構(gòu)詞能產(chǎn)性上的差異能夠反映詞庫與詞法之間的平衡關(guān)系。給定字
10、的當(dāng)前構(gòu)詞能產(chǎn)性越強(qiáng),其構(gòu)詞過程對于詞法的依賴程度可能就越高;反之,其構(gòu)成的詞就越有可能是存儲在心理詞庫當(dāng)中。
本研究從頻數(shù)的概念入手,研究漢語二字詞在真實(shí)語境中的形成機(jī)制。首先提出假設(shè),認(rèn)為頻數(shù)效應(yīng)在二字詞形成過程中的具體作用是在其局部語境中將其突顯為一個(gè)內(nèi)部結(jié)合強(qiáng)于外部結(jié)合的結(jié)構(gòu)性整體。滿足這種條件的字-字同現(xiàn)對是文本對應(yīng)的有向有權(quán)字同現(xiàn)網(wǎng)絡(luò)中的二節(jié)點(diǎn)邊島嶼。在取自兩種語類的漢語真實(shí)語料的基礎(chǔ)上,分別構(gòu)建了兩個(gè)以字為節(jié)點(diǎn)、
11、有向的字-字同現(xiàn)關(guān)系為邊、字-字同現(xiàn)關(guān)系頻數(shù)為邊權(quán)重的語言網(wǎng)絡(luò)模型。對兩個(gè)網(wǎng)絡(luò)的島嶼提取與分析結(jié)果表明,基本上只有漢語二字詞才能在有向有權(quán)字同現(xiàn)網(wǎng)絡(luò)中形成二字邊島嶼(即,內(nèi)部結(jié)合強(qiáng)于外部結(jié)合的有序字對)。而且,任何二字詞在適宜的語境中都有機(jī)會形成二字邊島嶼。這些發(fā)現(xiàn)表明,漢語二字詞作為結(jié)構(gòu)性整體的特性能夠在缺乏詞邊界的真實(shí)語境中自行體現(xiàn)出來。邊島嶼的概念為漢語二字詞作為結(jié)構(gòu)性整體在缺乏詞邊界標(biāo)記的語境中的突顯提供了明確的機(jī)制,該機(jī)制對于
12、二字詞在漢語的真實(shí)使用當(dāng)中的形成和習(xí)得具有至關(guān)重要的作用。另外,邊島嶼的提取過程還揭示了一些多字詞的形成過程及其內(nèi)部的層級結(jié)構(gòu)。
本研究從實(shí)證和定量的角度填補(bǔ)了漢語構(gòu)詞研究領(lǐng)域的某些空白,并有助于加深對于相關(guān)構(gòu)詞現(xiàn)象的認(rèn)識。本研究的發(fā)現(xiàn)表明,漢語構(gòu)詞的相關(guān)特征與機(jī)制能夠在較大程度上通過真實(shí)語境中的適宜統(tǒng)計(jì)特征體現(xiàn)出來。這些統(tǒng)計(jì)特征往往與相關(guān)的語言單位的相對頻數(shù)聯(lián)系密切。例如,字的同現(xiàn)字豐富程度是由字的同現(xiàn)字的相對頻數(shù)分布決定的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代漢語派生構(gòu)詞研究.pdf
- 現(xiàn)代漢語同形異構(gòu)詞研究.pdf
- 現(xiàn)代漢語合成詞構(gòu)詞研究.pdf
- 現(xiàn)代漢語動語素項(xiàng)構(gòu)詞研究.pdf
- 現(xiàn)代漢語后綴“者”構(gòu)詞規(guī)律的初步研究.pdf
- 現(xiàn)代漢語動詞計(jì)量方式研究.pdf
- 現(xiàn)代漢語常用成語的語義構(gòu)詞框架分析.pdf
- 現(xiàn)代漢語構(gòu)詞法中的詞綴化傾向研究.pdf
- 現(xiàn)代漢語擬聲詞構(gòu)詞理據(jù)性探析.pdf
- 現(xiàn)代漢語虛詞與現(xiàn)代漢語詩歌研究.pdf
- 現(xiàn)代漢語和阿塞拜疆語合成詞構(gòu)詞法比較研究.pdf
- 現(xiàn)代漢語詞匯課件造詞法和構(gòu)詞法
- 現(xiàn)代漢語
- 現(xiàn)代漢語修辭現(xiàn)代漢語課程組編
- 現(xiàn)代漢語語序研究.pdf
- 現(xiàn)代漢語歧義研究.pdf
- 現(xiàn)代漢語新詞研究.pdf
- 現(xiàn)代漢語焦點(diǎn)研究.pdf
- 現(xiàn)代漢語量詞研究.pdf
- 現(xiàn)代漢語情態(tài)研究.pdf
評論
0/150
提交評論