題名: | 以語料為本的中文專有名詞分類 |
作者: | 梁婷 葉政輝 吳典松 |
期刊名/會議名稱: | 中華民國92年全國計算機會議 |
摘要: | 正確的專有名詞的語意標示將有助於文 件擷取及訊息了解。在本論文中,我們提出一 個結合法則和統計方法的分類機制以標示中 文文件中中文人名和組織名稱。在人名標示上 主要利用人名常見字元來建立中文字元機率 模型。組織名稱的辦識則主要建立於專有名詞 前後常見詞彙與詞類標記整合。我們以中文平 衡語料庫語料做為訓練和測試資料以驗證所 提系統中不同模組的標示效能,進而建立最佳 的分類程序。 |
日期: | 2006-05-29T08:34:30Z |
分類: | 2003年 NCS 全國計算機會議 |
文件中的檔案:
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
WS_055200358.pdf | 203.76 kB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。