題名: | 結合網頁分類代理人之平行化階層式文件群聚法 |
作者: | 曾守正 古惟中 |
關鍵字: | FIHC文件群聚 平行處理 資料解群 |
期刊名/會議名稱: | 2007 NCS會議 |
摘要: | 面對網際網路上大量的網頁資訊,如何有效組織這些網頁資訊已經成為很重要的課題。本研究結合WebACE網頁分類代理人,運用解群技術、平行處理架構,實現「以高頻項目組合為基礎之階層式文件群聚法」(FIHC, Frequent Itemset-based Hierarchical Clustering),希望能有效提升網頁文件群聚執行效能,以及群聚品質。我們提出將WebACE網頁代理人所取得之分類網頁,利用「預先分類資料之解群方法」(Pre-classified De-clustering Method, PCD) 切割成為均等的工作單元,有效達成平行處理節點之間的負載平衡。在我們的平行架構中,各運算節點處理完成後,將運用FIHC演算法所產出之群集主題樹 (Topic Tree),將各節點所回傳之群集結果,利用XML檔案合併策略,將多個相同標籤的群集結果進行合併動作。最後,測試結果顯示在平行架構上採用FIHC演算法,在群聚品質與執行效能方面都有相當大幅度的提升。 |
日期: | 2008-08-06T02:04:12Z |
分類: | 2007年 NCS 全國計算機會議 |
文件中的檔案:
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
CE07NCS002007000013.pdf | 510.85 kB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。