完整後設資料紀錄
DC 欄位語言
dc.contributor.author古鴻炎
dc.contributor.author溫智旻
dc.date.accessioned2009-08-23T04:49:24Z
dc.date.accessioned2020-05-29T06:24:52Z-
dc.date.available2009-08-23T04:49:24Z
dc.date.available2020-05-29T06:24:52Z-
dc.date.issued2006-10-13T08:09:43Z
dc.date.submitted2005-12-15
dc.identifier.urihttp://dspace.fcu.edu.tw/handle/2377/1192-
dc.description.abstract本論文研究基於詞彙式大字符集之文本資料 壓縮方法,將中、英文檔案以詞彙為單位剖析出 token,再對token 以二階混合式預測模型或部分匹 配預測模型來估算出現機率,接著以算術編碼對該 機率編碼。由於字符集很大,影響預測模型的處理 速度,因此我們也研究一些可以加快處理的方法。 將上述想法實作為實際可壓縮、解壓縮的程 式後,作壓縮率的測試實驗,再和PPMd、bzip2、 及GZIP 程式作比較。對於中文檔案,我們的平均 壓縮率,比PPMd 好1.12%,比bzip2 好5.48%, 比GZIP 好17.02%。對於英文檔案,平均壓縮率 則比PPMd 好0.29%,比bzip2 好2.04%,比GZIP 好12.08%。所以,文本資料壓縮率的改進,相當 不容易,而本研究或多或少都得到了一些改進。議
dc.description.sponsorship崑山大學,台南縣永康市
dc.format.extent12p.
dc.format.extent614869 bytes
dc.format.mimetypeapplication/pdf
dc.language.isozh_TW
dc.relation.ispartofseries2005 NCS會議
dc.subject資料壓縮
dc.subject大字符集
dc.subject算術編碼
dc.subject.otherMultiMedia Processing & Segmentation
dc.title基於詞彙式大字符集、二階預測模型之文本資料壓縮
dc.title.alternativeText Compression Based onWord-Based Large Alphabet and Order-Two Prediction Model
分類:2005年 NCS 全國計算機會議

文件中的檔案:
檔案 描述 大小格式 
ce07ncs002006000232.pdf600.46 kBAdobe PDF檢視/開啟


在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。