科学技術文書データベースからの知識獲得に関する研究

閲覧数: 2
ダウンロード数: 0
このエントリーをはてなブックマークに追加

科学技術文書データベースからの知識獲得に関する研究

フォーマット:
助成・補助金
Kyushu Univ. Production 九州大学成果文献
責任表示:
松尾 文碩(九州大学・工学部・教授)
本文言語:
日本語
研究期間:
1992
概要(最新報告):
本研究の目的は、英文科学技術抄録文の理解であり、情報検索における高度質問処理と抄録文の英日翻訳への応用を目指している。自然言語理解における最初の問題点は、文脈自由文法に基づいて統語解析を行なうと、統語構造に極めて多数の曖昧さの解消に関する研究を行なった。 1.動詞の決定法 本研究における動詞決定法は、動詞候補選出手続きと動詞決定手続きから成る。動詞決定手続きは、動詞候補となる語句を正規文法によって決定する。動詞決定手続きは、動詞候補に優先度を付け、最も優先度の高い候補を動詞とする。優先度は、(1)助動詞を伴う動詞句、(2)be動詞とhave動詞、(3)単品詞機能語動詞、(4)多品詞機能語動詞、(5)常用語動詞、(6)その他の動詞、である。この決定法により、単文の抄録文2,404に対して93.1%の動詞を一意的に決定することができた。更に、手続きを改良したところ、この成功率が96.6%に向上した。 2.名詞句の決定法 名詞は、形容詞によって修飾されるが、名詞によっても修飾される。例えば、the system configurationのsystemは修飾名詞であり、the database systemのsystemは被修飾名詞である。そこで、単語の被修飾度を、単語が被修飾名詞として生起する相対頻度(確率)として定義する、人手によらず被修飾度を求めるために、まず機能語を使った被修飾名詞の決定法を開発した。この決定法を17,133の名詞句に適用したところ、成功率は91.9%であった。現在この決定法で求まる近似的な被修飾度を基に名詞句の構造を調査しているが、結論を出すには、あと1〜2箇月を要する、特筆すベきことは、andの対応関係にある語を同定する問題を同定する問題を解決できる見通しがつきそうなことである。 続きを見る
本文を見る

類似資料:

4
科学技術文書理解システム by 松尾 文碩; MATSUO Fumihiro
4.
科学技術文書理解システム by 松尾 文碩; MATSUO Fumihiro