<学術雑誌論文>
WebDBのQuery Formにおけるメタデータ自動抽出

作成者
本文言語
出版者
発行日
収録物名
開始ページ
終了ページ
出版タイプ
アクセス権
関連DOI
関連URI
関連情報
概要 各フィールドの属性値を指定することによりレコード検索を行うことができるWeb 上のデータベース(WebDB)が増えている.WebDB が提供するレコードの各フィールドの属性名のリストは, そのWebDB のメタデータと考えることができ, Web インタフェースの背後にあるデータベースを理解するために必須である.多数のWebDB に対し, 分類や選択を行ったり, 同種の(homogeneous)We...bDB あるいは異種(heterogeneous)のWebDB のメタサーチを構築するためにも,このメタデータは必須である.本論文ではWebDB の検索画面を構成するHTML のフォームからメタデータを自動的に抽出する方式を提案する.また, 国内の2,800 件のWebDB から無作為に選んだ134 件のサイトについて, メタデータ抽出実験を行い, 適合率, 再現率, F 値の3 つの観点から抽出性能を評価する.
There are increasing number of WebDBs (Web Databases) which return a list of records with respect to a complex query that specifies each field of records to be searched for. The attribute set of a WebDB can be thought as a metadata and is important to understand the database behind the Web interface. Moreover, it is indispensable to classify, to chose and to create homogeneous and/or heterogeneous metasearch engines from a large pool of WebDBs. This paper proposes a method which extracts the metadata from the HTML form of the WebDB. An empirical evaluation is conducted by assessing precision, recall an F-measure of extracted attributes for 134 sites randomly chosen from 2,800 WebDBs.
続きを見る

本文ファイル

pdf hirokawa_146 pdf 143 KB 251  

詳細

レコードID
査読有無
ISSN
NCID
登録日 2015.10.07
更新日 2022.01.18

この資料を見た人はこんな資料も見ています