完整後設資料紀錄
DC 欄位 | 值 | 語言 |
---|---|---|
dc.contributor.author | 許中川 | |
dc.contributor.author | 陳俊男 | |
dc.contributor.author | 胡勝傑 | |
dc.contributor.author | 林彥成 | |
dc.contributor.author | 邱宣諭 | |
dc.date.accessioned | 2009-06-02T07:20:28Z | |
dc.date.accessioned | 2020-05-29T06:19:28Z | - |
dc.date.available | 2009-06-02T07:20:28Z | |
dc.date.available | 2020-05-29T06:19:28Z | - |
dc.date.issued | 2006-11-08T03:12:35Z | |
dc.date.submitted | 1999-12-20 | |
dc.identifier.uri | http://dspace.fcu.edu.tw/handle/2377/2993 | - |
dc.description.abstract | 新聞文件記錄每天發生的重要事件,在這些大量的新聞文件中,往往蘊含重要的資訊。本研究提出一個自動化探勘架構,從大量的新聞文件中擷取出有用的關鍵詞彙,以關聯法則進一步萃取出潛藏的知識。在探勘過程中,針對中文新聞文件結構的特殊性,我們以結合詞庫式斷詞與統式斷詞的混合式斷詞法進行中文斷詞;根據新聞撰寫經驗法則,提出四個處理程序,取得新聞文件中較具代表性的關鍵詞彙;為切合新聞文件知識開採需求,使用概念階層樹建構背景知識與關鍵詞彙,搭配改良後的關聯法則,提出四個關聯模式:第一個是基本關聯法則,第二個是結構化資料與高頻詞彙關聯,第三個是結構化資料與同類詞彙關聯,第四個為非結構化資料的分佈差異。最後我們以實驗驗證此探勘架構的可行性。 | |
dc.description.sponsorship | 淡江大學, 台北縣 | |
dc.format.extent | 7p. | |
dc.format.extent | 889232 bytes | |
dc.format.mimetype | application/pdf | |
dc.language.iso | zh_TW | |
dc.relation.ispartofseries | 1999 NCS會議 | |
dc.subject | 文件資料探勘 | |
dc.subject | 關聯法則 | |
dc.subject | 中文斷詞 | |
dc.subject | 關鍵詞擷取 | |
dc.subject | 分佈差異 | |
dc.subject.other | 資訊擷取與資料挖掘 | |
dc.title | 中文新聞文件的關聯法則探勘 | |
分類: | 1999年 NCS 全國計算機會議 |
文件中的檔案:
檔案 | 描述 | 大小 | 格式 | |
---|---|---|---|---|
ce07ncs001999000113.pdf | 868.39 kB | Adobe PDF | 檢視/開啟 |
在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。