<departmental bulletin paper>
Genre Specific Characteristics of Lexicon from the Perspectives of Cluster Analysis and Frame Analysis : A Case Study of BCCWJ

Creator
Language
Publisher
Date
Source Title
Vol
First Page
Last Page
Publication Type
Access Rights
JaLC DOI
Abstract 本研究は、『現代日本語書き言葉均衡コーパス』における語彙頻度情報に基づき、語彙使用の特徴をジャンル別に明らかにすることを目的とする。基本語彙の特徴を明らかにするため、量的なアプローチとして動詞および名詞の高頻度語彙を対象にコーパスのジャンル間の共起関係を調べ、統計的な類似度の尺度の1つであるコサイン係数によって類似性を測定し、クラスター分析を行った。その結果、名詞・動詞ともに書籍コーパスと教科書コ...ーパスで大きな違いがあること、また文系・理系の分野間では類似性が見られることなどが明らかになった。次に、ジャンルごとの特徴を意味的に明らかにするため、各ジャンルにおける特徴的な動詞について、フレーム意味論およびFrameNetに基づき、フレームの観点から質的な分析を行った。その結果、各ジャンルには典型的に喚起されるフレームが存在することが明らかとなった。FrameNetにおけるフレーム間関係を用いて分析すると、例えば「文学」のジャンルでは「感情」「知覚」「身体動作」などに関するフレームが特徴的に見られることが分かり、これまで明らかにされてこなかったジャンルごとの意味的な特徴が浮かび上がる。
This study aims to clarify the genre specific characteristics of lexicon based on the frequency list of Balanced Corpus of Contemporary Written Japanese (BCCWJ). A quantitative approach was adopted to reveal the tendency of frequently-used words by examining co-occurrences of verbs and nouns among each genre of the corpus, which was converted into cosine coefficient to conduct a cluster analysis. The results indicate a clear difference between book subcorpora and textbook subcorpora, and at the same time, similarities within scientific genres and arts genres respectively, both for nouns and verbs. Then, a qualitative approach was employed with the genre specific verbs based on frame semantics and FrameNet to illustrate their semantic characteristics, which implied the existence of genre-specific frames. Using the frame-to-frame relations in FrameNet, it is clear that the genre of literature, for example, is closely associated with the frames of Emotions, Perception, and Body-movement indicating semantic characteristics of a particular genre, a point which previous studies have not successfully explained.
show more
Table of Contents 1. はじめに 2. 『現代日本語書き言葉均衡コーパス』 3. 高頻度語のクラスター分析 4. フレームによる特徴語の分析 5. まとめと今後の課題

Hide fulltext details.

pdf p021 pdf 1.60 MB 2,972  

Details

PISSN
NCID
Record ID
Peer-Reviewed
Spatial
Subject Terms
Type
Temporal
Created Date 2015.04.23
Modified Date 2023.11.01

People who viewed this item also viewed