題名: 中文音讀編碼與遮蔽法之中文文書自動校正
其他題名: Development of Automatic Chinese Document Revision System Using Phonetic information and Mask Technology
作者: 郭俊桔
柯明章
關鍵字: 自然語言處理
文書校正
遮蔽位元
遮蔽字元
音讀資訊
動態程式
期刊名/會議名稱: 1997 NCS會議
摘要:  中文文書的錯誤基本上可被分為輸入所造成的錯別字等錯誤和編輯所造成的掉字等錯誤.為了自動校正中文文書中的錯誤,通常都是參照中文語料庫製作相似字字集和計算中文文字的連結頻率後,執行校正作業.如此一來,雖可以解決輸入所造成的錯別字,但是無法有效解決編輯的錯誤.本論文提出一種中文讀音的編碼方式,使得類似讀音只有一個位元距離,而可以使用位元遮蔽法有效找出可能的錯別字.進一步又提出字元遮蔽法,以解決掉字等問題,如此一來,中文文書的自動校正正確率可由76%提高到87%.
日期: 2006-10-30T03:06:44Z
分類:1997年 NCS 全國計算機會議

文件中的檔案:
檔案 描述 大小格式 
ce07ncs001997000108.pdf637.77 kBAdobe PDF檢視/開啟


在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。