版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、命名實體識別及翻譯是自然語言處理中重要的基礎(chǔ)任務。數(shù)字時間表達式作為一類特殊的命名實體包含了關(guān)鍵信息,其識別與翻譯具有重要的理論意義和實用價值。數(shù)字時間表達式的識別與分析是信息檢索、事件抽取、事件檢測跟蹤及問答系統(tǒng)等自然語言處理任務的重要基礎(chǔ)。尤其在機器翻譯等多語言處理任務中,數(shù)字時間表達式的對齊及其翻譯質(zhì)量也是影響機器翻譯系統(tǒng)性能的重要因素。數(shù)字時間表達式識別與翻譯的研究對于提高機器翻譯系統(tǒng)性能及推進人工智能快速發(fā)展具有重要意義。
2、r> 本文從日漢雙語數(shù)字時間表達式的特性出發(fā),將語言學知識與統(tǒng)計方法相結(jié)合,通過大量的數(shù)據(jù)分析和實驗,對日漢雙語數(shù)字時間表達式的識別與翻譯方法進行了深入的研究和探索并將其應用于機器翻譯系統(tǒng)。本文的主要研究工作如下:
(1)基于最新的TIMEX3時間標注規(guī)范和通用的數(shù)字分類方式,結(jié)合日漢語言學知識中同構(gòu)和異構(gòu)情況,分別針對日語和漢語的數(shù)字時間表達式建立了觸發(fā)詞、邊界詞等關(guān)鍵詞知識庫,并將表達“概數(shù)”含義的詞包含在數(shù)字時間表達式
3、識別范圍中,使得數(shù)字時間表達式具有更豐富的含義;然后利用正則匹配的方式對數(shù)字時間表達式進行識別;最后將以上基于規(guī)則與基于統(tǒng)計的識別方法相融合,分別實現(xiàn)對日語和漢語數(shù)字時間表達式的識別。實驗結(jié)果表明,該識別方法在日語和漢語上都有較好的表現(xiàn)。
(2)在傳統(tǒng)的詞對齊方法中融入雙語數(shù)字時間表達式對齊,提出了一種基于位置約束和相似度度量相結(jié)合的數(shù)字時間表達式雙向?qū)R算法,實驗結(jié)果表明該算法能有效提高雙語詞對齊性能,輔助機器翻譯系統(tǒng)訓練生
4、成更優(yōu)的翻譯模型。
(3)根據(jù)日漢數(shù)字時間表達式的翻譯特點,建立數(shù)字時間表達式的翻譯規(guī)則庫,專用于數(shù)字時間表達式的獨立翻譯,并將雙語數(shù)字時間表達式的識別及對齊信息和翻譯規(guī)則庫有效融合到現(xiàn)有的統(tǒng)計機器翻譯系統(tǒng)中,提升機器翻譯中關(guān)于數(shù)字時間表達式及其鄰近詞的翻譯準確性,進而提升整體翻譯效果,并通過實驗得以驗證。
綜上所述,本文創(chuàng)新工作主要體現(xiàn)在:根據(jù)日漢數(shù)字時間表達式的特性,基于TIMEX3標注對時間詞的識別和翻譯規(guī)則進
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中文時間表達式識別研究.pdf
- 時間表達式識別與歸一化研究.pdf
- 中文時間表達式自動識別的研究.pdf
- 基于語義角色的中文時間表達式識別
- 規(guī)則與統(tǒng)計相結(jié)合的日語時間表達式識別與翻譯研究.pdf
- 課程設計--表達式翻譯
- 帶整數(shù)關(guān)系表達式的布爾表達式化簡方法研究.pdf
- el表達式
- 最右推導1〈表達式〉〈表達式〉〈運算符〉
- 基于SNoW文本中空間表達式的識別與分析.pdf
- 印刷體數(shù)學表達式識別技術(shù)的研究.pdf
- 印刷體化學表達式識別技術(shù)研究.pdf
- 聯(lián)機手寫數(shù)學表達式識別方法的研究.pdf
- el表達式的介紹
- 正則表達式
- el表達式的用法
- 印刷體數(shù)學表達式識別實現(xiàn)方法研究.pdf
- 基于正則表達式的關(guān)鍵事件識別與跟蹤系統(tǒng).pdf
- 檢索表達式構(gòu)建
- 化學表達式2
評論
0/150
提交評論