題名: | 基於大字符集柏洛菲勒轉換之中文文本資料壓縮方法 |
其他題名: | A Chinese Text Compression Scheme Based on Large-Alphabet BW-Transform |
作者: | 古鴻炎 劉景民 |
關鍵字: | 文本資料壓縮 大字符集 BWT文字轉換 算術編碼 |
期刊名/會議名稱: | 中華民國92年全國計算機會議 |
摘要: | 本論文提出一種基於大字符集柏洛-菲勒 轉換(Burrows-Wheelers Transform, BWT) 之 中文文本資料的壓縮方法,先以Big-5 加上 ASCII 形成的大字符集(alphabet)來剖析輸入 的中文文字檔案,再接著進行BWT、 MTF(Move to Front)、和算術編碼的處裡。我 們也研究了,在大字符集要求下能夠適用於 BWT、MTF 和算術編碼處裡上的實作方法, 以提升處理的速度。我們已經將這個壓縮方法 製作成可以實際使用之軟體程式,對於中文文 字檔案的測試實驗,結果顯示我們方法獲得的 壓縮率,比一般常被使用的Win-ZIP 好約 12%,比Win-RAR好約4%,而比原始的基於 BWT 的壓縮軟體BZIP2 的壓縮率好約 1%~2%。 |
日期: | 2006-06-14T01:13:38Z |
分類: | 2003年 NCS 全國計算機會議 |
文件中的檔案:
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
OT_1252003230.pdf | 274.23 kB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。