2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩117頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、全自動(dòng)的語(yǔ)義分析一直是自然語(yǔ)言理解的主要任務(wù)之一。通過(guò)深層語(yǔ)義分析,可以將自然語(yǔ)言轉(zhuǎn)化為形式語(yǔ)言,從而使計(jì)算機(jī)能夠與人類無(wú)障礙的溝通。為達(dá)此目的,人們已經(jīng)進(jìn)行了多年的努力,然而由于這一問(wèn)題過(guò)于復(fù)雜,目前取得的效果并不理想。淺層語(yǔ)義分析是對(duì)深層語(yǔ)義分析的一種簡(jiǎn)化,它只標(biāo)注與句子中謂詞有關(guān)的成分的語(yǔ)義角色,如施事、受事、時(shí)間和地點(diǎn)等。其能夠?qū)?wèn)答系統(tǒng)、信息抽取和機(jī)器翻譯等應(yīng)用產(chǎn)生推動(dòng)作用。語(yǔ)義角色標(biāo)注是淺層語(yǔ)義分析的一種實(shí)現(xiàn)方式,具有定義清

2、晰,便于評(píng)價(jià)的優(yōu)點(diǎn),近年來(lái)受到越來(lái)越多學(xué)者的關(guān)注。
  目前主流的語(yǔ)義角色標(biāo)注研究集中于使用各種統(tǒng)計(jì)機(jī)器學(xué)習(xí)技術(shù),利用多種語(yǔ)言學(xué)特征,進(jìn)行語(yǔ)義角色的識(shí)別和分類。近年的研究表明,影響語(yǔ)義角色標(biāo)注系統(tǒng)性能的首要因素并非機(jī)器學(xué)習(xí)模型,而是使用的特征。因此,若想提高系統(tǒng)的性能,細(xì)致的特征工程工作是必不可少的。然而,隨著越來(lái)越多特征的加入,特征之間的相互影響越來(lái)越嚴(yán)重,使得系統(tǒng)性能增長(zhǎng)的趨勢(shì)逐漸趨緩,并達(dá)到一個(gè)上限。為此必須尋找新的方法以解

3、決這一問(wèn)題。
  基于核的方法通過(guò)對(duì)已有特征進(jìn)行組合或者分解,將低維特征空間映射到高維特征空間,從而將在低維空間不容易區(qū)分的問(wèn)題在高維空間加以解決,是一種可行的解決方案。
  本文正是利用核方法這一優(yōu)點(diǎn),將其應(yīng)用于語(yǔ)義角色標(biāo)注這一問(wèn)題中。除了使用已有的核方法外,還提出了多種新的核方法。
  首先,我們構(gòu)造了一個(gè)語(yǔ)義角色標(biāo)注基線系統(tǒng),該系統(tǒng)使用特征向量表示待分類對(duì)象,并在特征向量之上,使用基于多項(xiàng)式核的方法,自動(dòng)的對(duì)特征

4、進(jìn)行組合。實(shí)驗(yàn)結(jié)果表明,當(dāng)使用二次多項(xiàng)式核對(duì)特征進(jìn)行兩兩組合時(shí),該系統(tǒng)是目前已知的最好的基于單句法分析器的語(yǔ)義角色標(biāo)注系統(tǒng)之一。
  接著,我們針對(duì)基線系統(tǒng)中,特征向量很難恰當(dāng)?shù)谋硎窘Y(jié)構(gòu)化的特征這一問(wèn)題,使用了卷積樹(shù)核自動(dòng)將較大的結(jié)構(gòu)特征進(jìn)行分解,并能夠在多項(xiàng)式時(shí)間內(nèi)進(jìn)行核函數(shù)的計(jì)算。然而,通常的卷積樹(shù)核混淆了語(yǔ)義角色標(biāo)注中不同的特征,因此,我們提出了混合卷積樹(shù)核融合多種樹(shù)核,來(lái)對(duì)不同種類的特征分別進(jìn)行建模,最終獲得優(yōu)于標(biāo)準(zhǔn)卷積樹(shù)

5、核的性能。然后將混合卷積樹(shù)核與二次多項(xiàng)式核進(jìn)行融合,得到的復(fù)合核取得了比單獨(dú)使用兩種核都好的結(jié)果。
  但是,標(biāo)準(zhǔn)卷積樹(shù)核要求兩棵子樹(shù)之間必須是精確匹配的,而不考慮結(jié)構(gòu)相似,語(yǔ)義角色相同的情況。因此,我們提出了新的句法驅(qū)動(dòng)卷積樹(shù)核,在核函數(shù)的設(shè)計(jì)過(guò)程中,融入了語(yǔ)言學(xué)知識(shí),容許結(jié)構(gòu)和節(jié)點(diǎn)的近似匹配,最終取得了較標(biāo)準(zhǔn)卷積樹(shù)更好的性能。最后同樣與多項(xiàng)式核進(jìn)行融合,并取得了更好的性能。
  最后,我們使用基于核的方法,實(shí)現(xiàn)了一個(gè)目前

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論