版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、作為自然語言理解的一項研究重點(diǎn),語義分析旨在將人類的自然語言轉(zhuǎn)化為計算機(jī)能夠理解的形式化語言。由于深層語義分析的復(fù)雜性,人們目前更關(guān)心淺層語義分析,一種簡化了的語義分析形式,分析句子中謂詞(動詞或名詞)的語義角色成分,包括施事者、受事者、時間、地點(diǎn)等。作為淺層語義分析的一種實現(xiàn)方式,語義角色標(biāo)注(Semantic Role Labeling,簡稱SRL)已被廣泛應(yīng)用于更高層次的自然語言處理相關(guān)任務(wù),如信息抽取、問答系統(tǒng)和機(jī)器翻譯等。根據(jù)
2、謂詞詞性的不同,通??梢詫⒄Z義角色標(biāo)注分為動詞性謂詞語義角色標(biāo)注和名詞性謂詞語義角色標(biāo)注。
目前主流的語義角色標(biāo)注研究都是基于短語結(jié)構(gòu)句法分析進(jìn)行的,并取得了一定的成果。但這種研究方案中,短語句法分析性能對語義角色標(biāo)注性能起著主導(dǎo)作用,是現(xiàn)階段語義角色標(biāo)注的瓶頸。因此有研究者開始探索使用依存句法分析進(jìn)行語義角色標(biāo)注。另從研究現(xiàn)狀看,針對中文語義角色標(biāo)注的研究要比英文的少得多,其中一個主要因為是缺乏合適的標(biāo)注語料。現(xiàn)階段由于
3、中文PropBank和中文NomBank的發(fā)布,使得對中文語義角色標(biāo)注的研究成為可能。因此,本文從依存關(guān)系出發(fā),研究中文語義角色標(biāo)注,主要研究內(nèi)容有以下三個方面:
首先,探索了中文謂詞標(biāo)注,包括動詞性謂詞和名詞性謂詞。謂詞標(biāo)注是語義角色標(biāo)注的前提,是語義角色標(biāo)注中的重要一步,其性能直接決定了語義角色標(biāo)注的性能。針對動詞性謂詞,本文實現(xiàn)了一個基于最大熵分類器的識別系統(tǒng),并在CoNLL2008和CoNLL2009評測數(shù)據(jù)上進(jìn)行
4、實驗;對名詞性謂詞的識別,除了采用基于最大熵分類器外,還采用了基于卷積樹核的方法,并在中文NomBank的轉(zhuǎn)換語料上進(jìn)行實驗。
其次,研究了基于特征向量的中文SRL。在構(gòu)建一個通用的基于特征向量的中文語義角色標(biāo)注平臺的基礎(chǔ)上,重點(diǎn)探討了特征選擇對系統(tǒng)性能的影響,并分別針對動詞性謂詞和名詞性謂詞制定不同的特征集合,分析各個特征對系統(tǒng)的貢獻(xiàn)度。實驗結(jié)果表明,系統(tǒng)在中文名詞性謂詞上的P/R/F1值分別為:71.37/86.20/
5、78.09。
最后,首次嘗試采用基于卷積樹核的方法對名詞性謂詞進(jìn)行語義角色標(biāo)注。其中重點(diǎn)討論了依存樹的構(gòu)造和剪枝,探索在結(jié)構(gòu)信息本身就很少的依存樹上,使得輸入的樹中盡量少的包含噪音信息。實驗表明,基于樹核函數(shù)的SRL結(jié)果與基于特征向量的結(jié)果已經(jīng)非常接近。本實驗作為基于卷積樹核的探索性實驗,為今后研究提供了有價值的參考。
本文的主要貢獻(xiàn)在于對基于依存關(guān)系的中文語義角色標(biāo)注進(jìn)行了全面研究,包括使用不同方法識別動詞
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于依存樹的中文語義角色標(biāo)注技術(shù)研究.pdf
- 基于依存分析的語義角色標(biāo)注研究.pdf
- 基于依存關(guān)系的語義表示方法研究.pdf
- 基于依存句法分析的語義角色標(biāo)注.pdf
- 基于依存樹核函數(shù)的語義角色標(biāo)注研究.pdf
- 基于語義依存關(guān)系的漢語句子分析研究.pdf
- 基于依存特征的漢語框架語義角色自動標(biāo)注.pdf
- 基于SVM的中文組塊間依存關(guān)系分析.pdf
- 中文樹庫依存關(guān)系解析的研究.pdf
- 基于特征選擇的中文語義角色標(biāo)注研究.pdf
- 基于特征的中文語義角色標(biāo)注系統(tǒng).pdf
- 中文語義角色標(biāo)注的方法研究.pdf
- 基于語義角色標(biāo)注的中文問答系統(tǒng)研究.pdf
- 基于樹核方法的中文語義角色標(biāo)注研究.pdf
- 基于SVM的確定性中文依存關(guān)系解析.pdf
- 中文復(fù)雜句語義角色標(biāo)注.pdf
- 中文子句語義角色標(biāo)注系統(tǒng)實現(xiàn)研究.pdf
- 基于依存關(guān)系的文本特征降維研究.pdf
- 基于語義角色標(biāo)注的微博人物關(guān)系抽取.pdf
- 基于圖和轉(zhuǎn)移算法相結(jié)合的中文依存關(guān)系解析.pdf
評論
0/150
提交評論