題名: 有效率地線上探勘關聯規則
作者: 陳垂呈
陳俊堯
關鍵字: 資料探勘
高頻項目組
關聯規則
布林運算
期刊名/會議名稱: 中華民國92年全國計算機會議
摘要: 資料探勘(data mining)是從大量交易資料中找出潛在有用的知識與資訊,在資料探勘技術可完成的工作中,以關聯規則(association rules)來表示項目之間的關聯性,是資料探勘最常使用的方法之一。在探勘關聯規則的過程中,若有新增交易資料時,則必須重新計算一次,將造成前次探勘計算的重複及資源的浪費,因此,在考量線上新增交易資料時,如何避免探勘計算的重複,以較少的計算時間來更新關聯規則,即成為探勘關聯規則最重要的問題之一。在本篇論文中,我們提出兩個演算法來線上探勘關聯規則:一是先以Apriori演算法來找出所有的關聯規則,在探勘的過程中,我們保留計算過程中的項目組與其出現次數、及高頻項目組與其出現次數於記憶體中,若有新增交易資料時,我們考量新增交易資料對記憶體中項目組及高頻項目組之出現次數的影響,若有產生新項目組時,則必須掃瞄全部的交易資料,以判斷這些項目組是否為高頻項目組;二是我們以布林運算為基礎,提出一個演算法,將可有效地提升前一方法的執行效能。從效能實驗顯示,我們所提出的探勘方法,將可有效地提升線上探勘關聯規則的執行效率。
日期: 2006-06-15T06:31:30Z
分類:2003年 NCS 全國計算機會議

文件中的檔案:
檔案 描述 大小格式 
OT_1302003265.pdf628.73 kBAdobe PDF檢視/開啟


在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。