<会議発表論文>
Automatic Generation of Deep Web Wrappers based on Discovery of Repetition

作成者
本文言語
出版者
発行日
収録物名
開始ページ
終了ページ
出版タイプ
アクセス権
関連DOI
関連URI
関連情報
概要 A Deep Web wrapper is a program that extracts contents from search results. We propose a new automatic wrapper generation algorithm which discovers a repetitive pattern from search results. The repeti...tive pattern is expressed by token sequences which consist of HTML tags, plain texts and wild-cards. The algorithm applies a string matching with mismatches to unify the variation from the template and uses FFT(fast Fourier transformation) to attain efficiency. We show an empirical evaluation of the algorithm for 51 Web databases.続きを見る

本文ファイル

pdf Nakatoh.AIRS04 pdf 151 KB 244  

詳細

レコードID
査読有無
主題
注記
タイプ
登録日 2009.07.01
更新日 2018.08.31

この資料を見た人はこんな資料も見ています