題名: | 一個適用於連續探勘的關連規則演算法 |
其他題名: | An efficient algorithm for continuously mining of association rules |
作者: | 呂永和 徐雅琪 |
關鍵字: | 資料探勘 關聯規則 資料壓縮 連續探勘 |
期刊名/會議名稱: | 中華民國92年全國計算機會議 |
摘要: | 目前有許多關聯規則演算將交易資料庫的資料,轉成儲存於主記憶體內部的資料結構,再對這個資料結構進行探勘的動作,由於資料掃瞄的動作是在主記憶體㆗進行;因此,其速度均比傳統的Apriori演算法還要快很多。但這些方法所面臨的共同難題,就是當交易資料庫太大時,這些方法必須將部份交易資料,存入磁碟機㆗,降低了資料探勘的速度。而且,㆒般的資料探勘工作,都需要對同㆒資料以不同參數連續探勘,方能找出有用的資訊。目前大多數演算法都只考量單次的資料探勘,並未考慮多次探勘時演算法的效率。 本論文提出㆒個以變動長度編碼(Run-length Encoding)為主的演算法稱為CM演算法,使用變動長度編碼技術,將交易資料庫壓縮成少量的資料,然後直接對主記憶體㆗的壓縮資料,進行連續的資料探勘,不需要將交易資料解壓縮。 經實驗證明,在多次探勘的情況㆘,CM演算法優於目前的演算法。 |
日期: | 2006-06-15T06:42:01Z |
分類: | 2003年 NCS 全國計算機會議 |
文件中的檔案:
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
OT_1312003266.pdf | 357.51 kB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。