Automatic Metadata Extraction from Query Form of WebDBs - Collections | Kyushu University Library

Back to Results List

＜journal article＞
Automatic Metadata Extraction from Query Form of WebDBs

Creator	Creator Name 中藤, 哲也 Nakatoh, Tetsuya ナカトウ, テツヤ Creator Alternative Name Nakato, Tetsuya Affiliation Affiliation Name 九州大学情報基盤研究開発センター Research Institute for Information Technology, Kyushu University
	Creator Name 大森, 敬介 Ohmori, Keisuke オオモリ, ケイスケ Creator Alternative Name Omori, Keisuke Affiliation Affiliation Name 三菱電機情報ネットワーク株式会社 Mistubishi Electric Information Network Corporation
	Creator Name 廣川, 佐千男 Hirokawa, Sachio ヒロカワ, サチオ Affiliation Affiliation Name 九州大学情報基盤研究開発センター Research Institute for Information Technology, Kyushu University
Language	Japanese
Publisher	日本データベース学会
Publisher	The Database Society of Japan
Date	2006-09
Source Title	日本データベース学会letters
Source Title	DBSJ letters
Vol	5
Issue	2
First Page	97
Last Page	100
Publication Type	Accepted Manuscript
Access Rights	open access
Related DOI	http://dbsj.org/
Related URI	http://dbsj.org/
Relation	http://dbsj.org/
Abstract	各フィールドの属性値を指定することによりレコード検索を行うことができるWeb 上のデータベース（WebDB）が増えている．WebDB が提供するレコードの各フィールドの属性名のリストは, そのWebDB のメタデータと考えることができ, Web インタフェースの背後にあるデータベースを理解するために必須である．多数のWebDB に対し, 分類や選択を行ったり, 同種の（homogeneous）We...bDB あるいは異種（heterogeneous）のWebDB のメタサーチを構築するためにも，このメタデータは必須である．本論文ではWebDB の検索画面を構成するHTML のフォームからメタデータを自動的に抽出する方式を提案する．また, 国内の2,800 件のWebDB から無作為に選んだ134 件のサイトについて, メタデータ抽出実験を行い, 適合率, 再現率, F 値の3 つの観点から抽出性能を評価する． There are increasing number of WebDBs (Web Databases) which return a list of records with respect to a complex query that specifies each field of records to be searched for. The attribute set of a WebDB can be thought as a metadata and is important to understand the database behind the Web interface. Moreover, it is indispensable to classify, to chose and to create homogeneous and/or heterogeneous metasearch engines from a large pool of WebDBs. This paper proposes a method which extracts the metadata from the HTML form of the WebDB. An empirical evaluation is conducted by assessing precision, recall an F-measure of extracted attributes for 134 sites randomly chosen from 2,800 WebDBs.show more

Hide fulltext details.

File	FileType	Size	Views	Description
hirokawa_146	pdf	143 KB	262

Details

Record ID	1526155
Peer-Reviewed	Refereed
ISSN	1347-8923
NCID	AA11967597
Created Date	2015.10.07
Modified Date	2022.01.18