日本語文章推敲支援システムのための漢字分類情報を用いた字面解析手法の構築

閲覧数: 2
ダウンロード数: 0
このエントリーをはてなブックマークに追加

日本語文章推敲支援システムのための漢字分類情報を用いた字面解析手法の構築

フォーマット:
助成・補助金
Kyushu Univ. Production 九州大学成果文献
責任表示:
菅沼 明(九州大学・工学部・講師)
本文言語:
日本語
研究期間:
1995
概要(最新報告):
本研究の目的として,日本語文章中に出現する漢字を手がかりにして文章を高速に解析する方法の構築をあげていた。 1.表を用いて活用語の活用形を推定する活用チェック法を構築した. 活用語を語幹と活用語尾に分解し,それぞれを解析するための表を用意した.語幹の最後の文字に現れる漢字を調査した結果,JIS第一水準漢字の83%が,漢字一文字で動詞,形容詞,形容動詞の区別ができることが判明した.これを利用して,語幹に関しては最後の文字だけを漢字と平仮名に区別して登録した.さらに,活用語尾表と語幹の表とで別々に品詞を推定し,両方の推定結果が一致した場合に,活用語の品詞と活用形を確定する活用チェック法を構築した. 2.接続助詞「が」の抽出および否定表現の抽出に活用チェック法を適用し,抽出精度が向上することを確かめた. 接続助詞「が」および否定表現の抽出法は,以前,判定条件を満たす文字列を抽出する方法で取り出していた.この抽出法を活用チェック法を利用する方法に変更した.新聞記事200万文字の文章を対象として,新しい方法で抽出実験を行なった結果,接続助詞「が」の抽出精度が95%,否定表現の抽出精度が87.3%と共に10%向上した. 3.活用チェック法を用いて動詞の表記揺れを指摘する方法を構築した. 活用チェック法によって文章中の動詞を抽出し,その表記の揺れ(送りが名の揺れ,漢字表記・平仮名表記の揺れなど)を検出する方法を構築した.この方法は文章を高速に解析し,揺れを取りこぼしなく抽出する. 続きを見る
本文を見る

類似資料:

9
講義自動撮影システムを用いた遠隔講義支援環境の構築に関する研究 by 菅沼 明; SUGANUMA Akira; 有田 大作; ARITA Daisaku
10
中国古典通俗文芸研究のための書目データベースの構築と公開 by 中里見 敬; NAKAZATOMI Satoshi; 二階堂 善弘; NIKAIDO Yoshihiro
9.
講義自動撮影システムを用いた遠隔講義支援環境の構築に関する研究 by 菅沼 明; SUGANUMA Akira; 有田 大作; ARITA Daisaku
10.
中国古典通俗文芸研究のための書目データベースの構築と公開 by 中里見 敬; NAKAZATOMI Satoshi; 二階堂 善弘; NIKAIDO Yoshihiro