<journal article>
Automatic Metadata Extraction from Query Form of WebDBs

Creator
Language
Publisher
Date
Source Title
Vol
Issue
First Page
Last Page
Publication Type
Access Rights
Related DOI
Related URI
Relation
Abstract 各フィールドの属性値を指定することによりレコード検索を行うことができるWeb 上のデータベース(WebDB)が増えている.WebDB が提供するレコードの各フィールドの属性名のリストは, そのWebDB のメタデータと考えることができ, Web インタフェースの背後にあるデータベースを理解するために必須である.多数のWebDB に対し, 分類や選択を行ったり, 同種の(homogeneous)We...bDB あるいは異種(heterogeneous)のWebDB のメタサーチを構築するためにも,このメタデータは必須である.本論文ではWebDB の検索画面を構成するHTML のフォームからメタデータを自動的に抽出する方式を提案する.また, 国内の2,800 件のWebDB から無作為に選んだ134 件のサイトについて, メタデータ抽出実験を行い, 適合率, 再現率, F 値の3 つの観点から抽出性能を評価する.
There are increasing number of WebDBs (Web Databases) which return a list of records with respect to a complex query that specifies each field of records to be searched for. The attribute set of a WebDB can be thought as a metadata and is important to understand the database behind the Web interface. Moreover, it is indispensable to classify, to chose and to create homogeneous and/or heterogeneous metasearch engines from a large pool of WebDBs. This paper proposes a method which extracts the metadata from the HTML form of the WebDB. An empirical evaluation is conducted by assessing precision, recall an F-measure of extracted attributes for 134 sites randomly chosen from 2,800 WebDBs.
show more

Hide fulltext details.

pdf hirokawa_146 pdf 143 KB 262  

Details

Record ID
Peer-Reviewed
ISSN
NCID
Created Date 2015.10.07
Modified Date 2022.01.18

People who viewed this item also viewed