<会議発表論文>
手掛語に着目した問題文識別についてのナイーブベイズによる評価実験

作成者
本文言語
出版者
発行日
収録物名
開始ページ
終了ページ
会議情報
出版タイプ
アクセス権
権利関係
関連DOI
関連URI
関連情報
概要 研究者にとって関連論文調査は必須であり,特に,対象とする論文が何を問題ととらえているかという観点は重要である.したがって,論文概要から問題を記述している文(問題文)を自動的に抽出できれば,調査の精度と効率の向上が期待できる.SVM などの機械学習により判別機を構築できるが,判別性能を上げるには多量の学習例を人手で準備しなければならないという問題がある.筆者らはSVM を使ったこれまでの研究で,少数...の学習例しかない場合でも,問題文を特徴付ける手掛り語集合に着目することで,全ての単語を用いるより判別性能を格段に向上できることを示している.本稿では,学習機としてナイーブベイズを用いた場合も,手掛り語集合が判別性能向上に有効であることを示す.さらにその性能向上率は,SVM の場合より高いことを示す.
It is important for researchers to investigate related work. In particular, it is important to consider the viewpoint that describes the problem of the paper they are aiming to find. Therefore, if we can automatically extract the problem sentences from paper abstract, our method is expected to improve the accuracy and the investigation and efficient. SVM is machine learning algorithm that can make classifications. But there are problems that we must first prepare many learning samples manually to increase classification efficiently. In past research we have proposed a method which can improve the classification efficiency by focusing on characterizing clue problem sentences. With only a samll number of learning samples we can obtain superior results. In this paper, we show that also by in addition to using naivebayes with clues is more effective than vectorizing by all words. Moreover, we show that the improved efficiency is higher than that when compared to SVM.
続きを見る

本文ファイル

pdf hirokawa_50 pdf 290 KB 377  

詳細

レコードID
注記
登録日 2015.04.01
更新日 2023.08.17

この資料を見た人はこんな資料も見ています