題名: 文件剖析方法對提升資訊檢索精確率影響之研究
作者: 張錫正
殷欣靖
徐俊傑
關鍵字: 資訊檢索
文件剖析
查詢主題
相關回饋
期刊名/會議名稱: 2001 NCS會議
摘要: 網際網路技術的快速進步及普及,網路上電子式文件(electric documents)資料亦巨幅成長,綱路形成一個巨大的資料倉儲(data warehouse)。搜尋引擎(search engine)是目前綱路上文件資料搜尋的主要工具,由於現有的搜尋引擎大多使用關鍵詞彙為基礎(keyword based)的查詢方式,此種查詢方式一般使用者所輸入的查詢詞彙個數有限,加上語言學上的「一字多義」與「一義多詞」的問題,易導致查詢主題模糊難於確認,在面對網路如此巨大的資料量時,常會找到太多不相關的資料,使真正的資料隱沒其中。另一方面,由於綱路資料的動態變化性、資料格式的多樣性及資料的快速巨幅增長,使得搜尋引擎搜尋結果之精確率已大幅降低到其實用性受到嚴重考驗。 為解決上述問題,除了更新搜尋引擎所用之檢索技術外,如何協助及早確定使用者查詢主題,精確且有效地描述出查詢者的查詢意向,有效且大幅地過濾掉不相關的搜詢結果,無外乎是提高搜尋結果之精確率的最有效方法。本論文提出:(一)詞彙群組剖析(二)反查式搜尋剖析(三)段落式文件剖析(四)文件段落比對剖析及(五)相關性回饋調適等五種方法來協助及早確認使用者查詢主題與過濾掉不相關的搜詢結果,經由實驗結果來評估這四種文件剖析方式對於查詢結果之精確率的影響。另根據使用者搜尋紀錄與閱讀行為找出適當的回饋文件,使查詢主題更精確進而獲得最佳的查詢效能。
日期: 2006-10-18T10:59:30Z
分類:2001年 NCS 全國計算機會議

文件中的檔案:
檔案 描述 大小格式 
ce07ncs002001000190.pdf742.69 kBAdobe PDF檢視/開啟


在 DSpace 系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。