<紀要論文>
クラスター分析とフレーム分析による語彙のジャンル別特徴 : 「現代日本語書き言葉均衡コーパス」を用いて

作成者
本文言語
出版者
発行日
収録物名
開始ページ
終了ページ
出版タイプ
アクセス権
JaLC DOI
概要 本研究は、『現代日本語書き言葉均衡コーパス』における語彙頻度情報に基づき、語彙使用の特徴をジャンル別に明らかにすることを目的とする。基本語彙の特徴を明らかにするため、量的なアプローチとして動詞および名詞の高頻度語彙を対象にコーパスのジャンル間の共起関係を調べ、統計的な類似度の尺度の1つであるコサイン係数によって類似性を測定し、クラスター分析を行った。その結果、名詞・動詞ともに書籍コーパスと教科書コ...ーパスで大きな違いがあること、また文系・理系の分野間では類似性が見られることなどが明らかになった。次に、ジャンルごとの特徴を意味的に明らかにするため、各ジャンルにおける特徴的な動詞について、フレーム意味論およびFrameNetに基づき、フレームの観点から質的な分析を行った。その結果、各ジャンルには典型的に喚起されるフレームが存在することが明らかとなった。FrameNetにおけるフレーム間関係を用いて分析すると、例えば「文学」のジャンルでは「感情」「知覚」「身体動作」などに関するフレームが特徴的に見られることが分かり、これまで明らかにされてこなかったジャンルごとの意味的な特徴が浮かび上がる。
This study aims to clarify the genre specific characteristics of lexicon based on the frequency list of Balanced Corpus of Contemporary Written Japanese (BCCWJ). A quantitative approach was adopted to reveal the tendency of frequently-used words by examining co-occurrences of verbs and nouns among each genre of the corpus, which was converted into cosine coefficient to conduct a cluster analysis. The results indicate a clear difference between book subcorpora and textbook subcorpora, and at the same time, similarities within scientific genres and arts genres respectively, both for nouns and verbs. Then, a qualitative approach was employed with the genre specific verbs based on frame semantics and FrameNet to illustrate their semantic characteristics, which implied the existence of genre-specific frames. Using the frame-to-frame relations in FrameNet, it is clear that the genre of literature, for example, is closely associated with the frames of Emotions, Perception, and Body-movement indicating semantic characteristics of a particular genre, a point which previous studies have not successfully explained.
続きを見る
目次 1. はじめに 2. 『現代日本語書き言葉均衡コーパス』 3. 高頻度語のクラスター分析 4. フレームによる特徴語の分析 5. まとめと今後の課題

本文ファイル

pdf p021 pdf 1.60 MB 2,915  

詳細

PISSN
NCID
レコードID
査読有無
地域
主題
タイプ
時代・年代
登録日 2015.04.23
更新日 2023.11.01

この資料を見た人はこんな資料も見ています