面向漢字教學的錯字處理工具設計與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、“漢語熱”現(xiàn)象及“孔子學院”的開辦表明漢語正在走向世界,漢語已經(jīng)成為第二語言學習的重要選擇。漢語性質(zhì)獨特,非漢字文化圈的外國漢語學習者學習漢語難度極大,其中尤以漢字難學。漢字初學者極易將漢字寫錯。漢字教學難的現(xiàn)狀已經(jīng)制約了國內(nèi)語文教學和漢語國際推廣工作的進一步發(fā)展。不同初始特征的學習者在漢字學習過程中出現(xiàn)的書寫錯誤具有不同的規(guī)律。
   但是,目前還沒有基于大規(guī)模錯字樣本的書寫偏誤統(tǒng)計分析研究成果為漢字教學提供指導和服務。主要原

2、因是錯字的計算機處理(錯字編碼、錯字輸入輸出、錯字檢索統(tǒng)計等)還存在很多困難。錯字的編碼問題主要體現(xiàn)在Unicode預留的用戶私有編碼區(qū)無法滿足規(guī)模不斷膨脹的錯字需求,而且錯字的編碼由使用者自行定義,造成編碼混亂,無法進行交換和共享。使用現(xiàn)有的各種輸入法向計算機系統(tǒng)中錄入的漢字都是標準字符集內(nèi)的漢字,無法錄入錯字,只能以圖片方式顯示錯字,不能支持錯字的檢索和統(tǒng)計。因此,缺乏符合國際標準的錯字編碼方案和簡易有效的錯字輸入、管理方法是造成計

3、算機難以有效處理錯字信息的主要障礙。
   為了有效地解決計算機處理錯字問題,本文重點完成了以下幾方面的工作:
   (1)分析了漢語教學領域錯字分類的研究成果,建立了一種適合計算機處理、以字形為依據(jù)的錯字分類方案。
   (2)以漢字字形特征為依據(jù),基于Unicode國際標準,建立了一種以正字為中心、范圍可擴展的錯字編碼方案,即采用正字加表意文字變體選擇符組成的變體序列(Ideographic Variatio

4、n Sequences,IVS)作為錯字編碼的方案。這種方案使錯字的編碼統(tǒng)一到國際標準編碼框架下,并在編碼層次與正字建立了關聯(lián),能夠有效地表示和管理大規(guī)模錯字。
   (3)采用OpenType智能字體技術實現(xiàn)了IVS模式的錯字編碼方案。并使用專業(yè)字體制作工具設計完成了具有一定數(shù)量的宋體錯字OpenType字庫,為錯字可以與正字一樣進行計算機處理建立了基礎,可在記事本等軟件中實現(xiàn)錯字與正字同文顯示、統(tǒng)一檢索。
   (4

5、)基于上述的錯字編碼方案和OpenType錯字字庫,設計實現(xiàn)了一個面向漢字教學研究人員、操作簡便的Office錯字輸入插件工具。使用該工具可以向Word、Excel、PowerPoint、Access等軟件中輸入錯字。與內(nèi)碼輸入方法相比,該方法極大地提高了輸入速度,操作也更加方便、簡易,適合非專業(yè)人員使用。
   本文的以上工作成果有效地解決了錯字輸入輸出、檢索、管理和共享問題,為基于大規(guī)模錯字樣本的書寫偏誤定量分析建立了基礎。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論