題名: 一個適用於連續探勘的關連規則演算法
其他題名: An efficient algorithm for continuously mining of association rules
作者: 呂永和
徐雅琪
關鍵字: 資料探勘
關聯規則
資料壓縮
連續探勘
期刊名/會議名稱: 中華民國92年全國計算機會議
摘要: 目前有許多關聯規則演算將交易資料庫的資料,轉成儲存於主記憶體內部的資料結構,再對這個資料結構進行探勘的動作,由於資料掃瞄的動作是在主記憶體㆗進行;因此,其速度均比傳統的Apriori演算法還要快很多。但這些方法所面臨的共同難題,就是當交易資料庫太大時,這些方法必須將部份交易資料,存入磁碟機㆗,降低了資料探勘的速度。而且,㆒般的資料探勘工作,都需要對同㆒資料以不同參數連續探勘,方能找出有用的資訊。目前大多數演算法都只考量單次的資料探勘,並未考慮多次探勘時演算法的效率。 本論文提出㆒個以變動長度編碼(Run-length Encoding)為主的演算法稱為CM演算法,使用變動長度編碼技術,將交易資料庫壓縮成少量的資料,然後直接對主記憶體㆗的壓縮資料,進行連續的資料探勘,不需要將交易資料解壓縮。 經實驗證明,在多次探勘的情況㆘,CM演算法優於目前的演算法。
日期: 2006-06-15T06:42:01Z
分類:2003年 NCS 全國計算機會議

文件中的檔案:
檔案 描述 大小格式 
OT_1312003266.pdf357.51 kBAdobe PDF檢視/開啟


在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。