日本語処理のためのプログラミング支援環境の構築に関する研究

閲覧数: 11
ダウンロード数: 0
このエントリーをはてなブックマークに追加

日本語処理のためのプログラミング支援環境の構築に関する研究

フォーマット:
助成・補助金
Kyushu Univ. Production 九州大学成果文献
タイトル(他言語):
Construction of Programming Support Environment for Japanese Text Processing
責任表示:
牛島 和夫(九大・工学部・教授)
Ushijima Kazuo(九大・工学部・教授)
本文言語:
日本語
研究期間:
1985-1986
概要(最新報告):
1.日本語テキストは従来の英数文字(1バイト)と日本語文字(2バイト)とが混在する。この研究を始めるに当って混在コードの処理を容易に行うために、正規化日本語テキストを設定した。これは英数文字の前に1バイトのパッディングを加え各文字の長さを2バイトに正規化したものである。 2.この日本語テキストに英文テキストの上で有効性の確認されている幾つかの文字列照合アルゴリズムを適用してその効率を比較した。その結果、英文テキスト上で最も効率がよいとして知られているBoyer-Moore法が字種の多い日本語テキストでは反って効率が落ちることが分った。検索に用いる字種の大きさの表を階層的に構成することによって本来の効率を復活出来ることを示した。さらに日本語テキストを1バイトコードの列と見做して文字列照合を行う。Boyer-Moore法を適用するのが最も効率がよい。この際、ずれ読みを検出するためにテキストの正規化が本質的であることを明らかにした。 3.上記の研究成果を包含して、元来日本語文字の扱いが不可能なプログラミング言語Adaに日本語テキスト処理を可能とするパッケージを構築した。正規化日本語テキストの上に開発されたアルゴリズムをAdaのパッケージとして纒める際に2バイト文字を2要素からなるレコードに対応させている。このパッケージの環境のもとで日本語処理プログラミングを自然に行うことができるようになった。 4.上のように整備したプログラミング環境のもとで応用として日本語文章推敲支援ツールのプロトタイプを作成した。これは機械可読の日本語文章を字面だけで解析して推敲に必要な個所を指摘しようというツールである。 5.九州大学情報処理教育センターにおいてプログラミング入門の講議を受けている学生を対象に日本語化したエラーメッセージの効果と利用状況について調査を行った。 続きを見る
本文を見る

類似資料:

2
近似文字列照合のための効率的なアルゴリズム by 中藤, 哲也; Nakatoh, Tetsuya; 馬場, 謙介; Baba, Kensuke; 山田, 泰寛; Yamada, Yasuhiro; 池田, 大輔; …
2.
近似文字列照合のための効率的なアルゴリズム by 中藤, 哲也; Nakatoh, Tetsuya; 馬場, 謙介; Baba, Kensuke; 山田, 泰寛; Yamada, Yasuhiro; 池田, 大輔; …