版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、漢語(yǔ)分詞是信息檢索、機(jī)器翻譯、文本校對(duì)等中文信息處理重要領(lǐng)域的基礎(chǔ)。由于漢語(yǔ)中存在詞語(yǔ)規(guī)范、歧義和未登錄詞等問(wèn)題,漢語(yǔ)分詞一直困擾著中文信息技術(shù)的發(fā)展。因此,研究漢語(yǔ)分詞具有十分重要的意義。同時(shí),在分詞應(yīng)用方面,基于網(wǎng)絡(luò)的在線測(cè)試分詞系統(tǒng)僅提供測(cè)試功能,存在只能處理少量文本、用戶(hù)使用不方便、程序無(wú)法直接調(diào)用等缺點(diǎn)。 網(wǎng)格是近年來(lái)繼Internet、WWW技術(shù)后興起的一種新技術(shù),能為復(fù)雜應(yīng)用提供分布式并行環(huán)境。網(wǎng)格服務(wù)可以以不同的
2、方式聚集起來(lái)滿(mǎn)足應(yīng)用的需要,提高代碼重用率。所以,開(kāi)發(fā)一個(gè)基于網(wǎng)格的面向用戶(hù)和程序的分詞服務(wù)系統(tǒng),以服務(wù)形式為中文信息處理的基礎(chǔ)研究提供支撐環(huán)境,有一定的意義。 本文首先研究了漢語(yǔ)分詞應(yīng)用需求的多樣性,結(jié)合網(wǎng)格的特點(diǎn)設(shè)計(jì)了七個(gè)服務(wù)算法。為盡量減少代碼移植的工作量,本文研究了GT4的CWSCore,分析用C語(yǔ)言實(shí)現(xiàn)網(wǎng)格服務(wù)的原理和方法,然后將上述七種算法封裝成服務(wù),在網(wǎng)格平臺(tái)上發(fā)布。根據(jù)這些算法生成的網(wǎng)格服務(wù),可以以不同的方式組合
3、起來(lái),形成多種類(lèi)型的分詞服務(wù),從而滿(mǎn)足不同的分詞應(yīng)用需求?;贕T4的網(wǎng)格服務(wù)多采用Java語(yǔ)言實(shí)現(xiàn),而現(xiàn)有平臺(tái)下的大量的應(yīng)用程序使用C語(yǔ)言開(kāi)發(fā)。因此本文的方法對(duì)C語(yǔ)言應(yīng)用程序的網(wǎng)格移植有一定的參考意義。 同時(shí),本文還研究了Olobus的作業(yè)管理機(jī)制、Condor系統(tǒng)和PVM并行虛擬機(jī)系統(tǒng),提出了Condor-PVM與Globus結(jié)合的并行計(jì)算機(jī)制,解決了網(wǎng)格環(huán)境中用C語(yǔ)言編程實(shí)現(xiàn)分布式并行計(jì)算的問(wèn)題。實(shí)驗(yàn)證明該機(jī)制在處理大規(guī)模
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于語(yǔ)法的分詞系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于OGSA的網(wǎng)格數(shù)據(jù)庫(kù)服務(wù)系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于WSRF的多媒體網(wǎng)格信息服務(wù)系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于網(wǎng)格的VOD信息服務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于實(shí)例的中文分詞系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于SegTree的漢語(yǔ)分詞系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于網(wǎng)格信息服務(wù)的網(wǎng)格監(jiān)控系統(tǒng)的研究與設(shè)計(jì).pdf
- 中文自動(dòng)分詞系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于字的分詞方法的研究與實(shí)現(xiàn).pdf
- 基于OGSA的網(wǎng)格記賬系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于Web的網(wǎng)格系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于并行計(jì)算的中文分詞系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于Globus存儲(chǔ)網(wǎng)格傳輸服務(wù)的研究與實(shí)現(xiàn).pdf
- 基于SOA的網(wǎng)格服務(wù)平臺(tái)安全服務(wù)的研究與實(shí)現(xiàn).pdf
- 基于globus存儲(chǔ)網(wǎng)格傳輸服務(wù)的研究與實(shí)現(xiàn)
- 基于CRF的中文分詞研究與實(shí)現(xiàn).pdf
- 基于Globus Toolkit的網(wǎng)格信息服務(wù)的研究與實(shí)現(xiàn).pdf
- 基于Jetspeed的服務(wù)網(wǎng)格門(mén)戶(hù)技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于雙數(shù)組的分詞詞典研究與實(shí)現(xiàn).pdf
- 基于CRFs的中文分詞算法研究與實(shí)現(xiàn).pdf
評(píng)論
0/150
提交評(píng)論