<会議発表論文>
Testbed for Information Extraction from Deep Web

作成者
本文言語
出版者
発行日
収録物名
開始ページ
終了ページ
出版タイプ
アクセス権
関連DOI
関連URI
関連情報
概要 Search results generated by searchable databases are served dynamically and far larger than the static documents on the Web. These results pages have been referred to as the Deep Web [1]. We need to e...xtract the target data in results pages to integrate them on different searchable databases. We propose a testbed for information extraction from search results. We chose 100 databases randomly from 114,540 pages with search forms. Therefore, these databases have a good variety. We selected 51 databases which include URLs in a results page and manually identify target information to be extracted. We also suggest evaluation measures for comparing extraction methods and methods for extending the target data.続きを見る

本文ファイル

pdf www2004 pdf 17.8 KB 360  

詳細

レコードID
査読有無
主題
注記
タイプ
登録日 2009.04.22
更新日 2023.11.27

この資料を見た人はこんな資料も見ています