<会議発表論文>
Automatic Generation of Deep Web Wrappers based on Discovery of Repetition

作成者
本文言語
出版者
発行日
雑誌名
開始ページ
終了ページ
出版タイプ
アクセス権
概要 A Deep Web wrapper is a program that extracts contents from search results. We propose a new automatic wrapper generation algorithm which discovers a repetitive pattern from search results. The repeti...tive pattern is expressed by token sequences which consist of HTML tags, plain texts and wild-cards. The algorithm applies a string matching with mismatches to unify the variation from the template and uses FFT(fast Fourier transformation) to attain efficiency. We show an empirical evaluation of the algorithm for 51 Web databases.続きを見る

本文情報を非表示

Nakatoh.AIRS04 pdf 151 KB 98  

詳細

レコードID
査読有無
関連情報
主題
注記
タイプ
登録日 2009.07.01
更新日 2017.01.19