高度情報検索システムのための言語情報処理に関する研究

閲覧数: 9
ダウンロード数: 0
このエントリーをはてなブックマークに追加

高度情報検索システムのための言語情報処理に関する研究

フォーマット:
助成・補助金
Kyushu Univ. Production 九州大学成果文献
責任表示:
松尾 文碩(九州大学・工学部・助教授)
本文言語:
日本語
研究期間:
1987
概要(最新報告):
本研究において知見を得たいことの一つは, 研究代表者らが開発した1,667単語の否定辞書をもとに, 約2,000語の英文科学技術文献用機能語を定め, それらの機能語の構文.意味情報によって, 抄録文がどの程度"理解"できるかということである. 1,667単語のうち, 動詞を品詞としてもつ単語が最も多いということは, これらの機能語による"理解"についてある程度の可能性を示唆するものである. しかし, 動詞に関しては, これらの機能語に含まれる動詞だけでは十分ではない. その原因の一は, 動詞makeの用法がある. 例えば, "make measurements"というとき, 大意は動詞measureである. 従って, この場合, 形式的にはmakeが動詞であっても, mesurementのような名詞が実質的に動詞の役割を果している. そこで, 本年度は科学技術抄録文におけるmakeの用法を調査した. ここでは, "make measurements"のような用法を行為化用法というと, 行為化用法はmakeの用法の約半分(53.6%)を占めることがわかった. また, 行為化用法の名詞数Dは, 行為化用法数Tの平方根に比例することが判明した. 単語の異なり数も単語の延べ数の平方根に比例することが知られているが, 行為化用法の名詞数の場合の比例定数は一般の単語の場合の1/3.5である. 更に, 行為化用法の低頻度名詞の相対生起頻度(生起確率)が低頻度単語と同様に, 生起順位の二乗に逆比例するとしたら, 比例係数は一般の単語の1/12であることを示すことができる. 以上のことから, 87万の調査文の範囲内では, 行為化用法の名詞数には上限は認められないが, 用法数の増加に伴う名詞の異なり数の増加は緩やかであり, かつ低頻度名詞を伴う用例は比較的少数であるので, 高頻度名詞だけでも, かなりの文章理解が可能であると判断できる. つまり, makeの行為化用法は比較的少数の機能語による"理解"を防げるものではないことが示された. 続きを見る
本文を見る

類似資料:

5
高性能情報検索システムに関する研究 by 二村, 祥一; FUTAMURA, S
6
科学技術文書理解システム by 松尾 文碩; MATSUO Fumihiro
5.
高性能情報検索システムに関する研究 by 二村, 祥一; FUTAMURA, S
6.
科学技術文書理解システム by 松尾 文碩; MATSUO Fumihiro