基于深度學(xué)習(xí)的實體鏈接方法.pdf_第1頁
已閱讀1頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、文本理解在自然語言處理和人工智能領(lǐng)域起著重要的作用,實體鏈接是幫助計算機理解文本的重要研究內(nèi)容。實體鏈接指將一段文本中的實體指稱抽取出來,將這些實體指稱消歧后映射到指定知識庫中的唯一實體上。實體鏈接能夠幫助計算機找到句子中的重要語義信息,判斷詞語在不同上下文語境中的不同含義,在幫助計算機理解自然語言中是不可或缺的。從兩個角度提出了實體鏈接方法,分別是基于百科網(wǎng)站屬性表的實體鏈接和基于純文本的實體鏈接。
  本研究從人理解文本的角度

2、出發(fā),從詞語理解到句子理解,闡述了分詞,詞向量表達(dá),文檔向量表達(dá),同義詞映射等基本的自然語言處理過程,并根據(jù)百度百科、互動百科、中文維基百科構(gòu)建了一個基礎(chǔ)的中文知識庫。首先提出了一種基于機器學(xué)習(xí)的排序算法來處理屬性表格中的實體消歧問題,旨在加強中文知識庫中實體的關(guān)聯(lián)性。然后提出了一種基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的文本實體鏈接算法,從文本中抽取實體指稱并尋找對應(yīng)的候選集實體,利用雙向長短期網(wǎng)絡(luò)對實體指稱以及實體指稱的類型建立模型,利用深度卷積神經(jīng)

評論

0/150

提交評論