科学技術文書の為のOCR(光学文字読み取り)システムの開発研究

閲覧数: 14
ダウンロード数: 0
このエントリーをはてなブックマークに追加

科学技術文書の為のOCR(光学文字読み取り)システムの開発研究

フォーマット:
助成・補助金
Kyushu Univ. Production 九州大学成果文献
タイトル(他言語):
Development of OCR (optical character recognition) system for scientific documents
責任表示:
鈴木 昌和(九州大学・大学院・数理研究院・教授)
SUZUKI Masakazu(九州大学・大学院・数理研究院・教授)
本文言語:
日本語
研究期間:
1998-2001
概要(最新報告):
この研究は数式を含む文書のスキャナ画像を認識し、科学技術文書の電子化や自動点訳などに応用できるシステムの開発を目指したものである。画像のレベルとしては、比較的鮮明に印刷された文書を400dpi~600dpiでスキャンしたものを認識象とした。 数学記号を認識できる市販の文字認識エンジンは存在しないため、科学技術文書の英数字や記号類の印刷字体の採集を行い、高度な数学記号まで認識する数式用の文字認識エンジンを独自に開発した。複数の特徴量を併用した認識アルゴリズムを用いて、英数字については市販OCRと同程度の認識能力を保ちながら、約450種類の文字・記号の識別が可能な認識エンジンを開発できた。英字の立体・イタリックの識別も高精度で行う。 文章中では文字認識精度を向上させるために単語辞書やbigram, trigramなどの言語情報を用いた補正が有効であり、他方、数式中では別のメカニズムに基づいた誤認識補正が必要となる。そのため、頁画像を行分割後、文章領域と数式領域の分離を行うアルゴリズムを、日本語文書と英語文書に対して開発した。 数式構造解析については、各文字・記号の認識候補文字間を仮想リンクで結んだネットワークを生成し、最小コストの全域木として数式構造解析結果を取得する方法を開発した。ネットワーク構成時の局所的なコストによる上位の数式構文木候補を複数取り出し、最後に大域的な数式としての構造から決まるコストによって再評価することで、大きさの異なる類似文字の誤認識や、印刷書体による記号の大きさの違いなどによる局所的な誤りが全体の構造コストによって自動補正され、安定した結果が得られる手法となった。 また、認識結果を数式も含めて、容易に修正できるユーザー・インターフェースの研究も行い、オンライン・手書き数式入力による数式編集システムを開発した。 続きを見る
本文を見る

類似資料:

1
科学技術文書電子化システムの研究 by 鈴木 昌和; SUZUKI Masakazu
7
Databases of Mathematical Documents by Suzuki, Masakazu; 鈴木, 昌和; Malon, Christopher; Uchida, Seiichi; 内田, 誠一
4
Mathematical Symbol Recognition with Support Vector Machines by Malon, Christopher; Uchida, Seiichi; 内田, 誠一; Suzuki, Masakazu; 鈴木, 昌和
1.
科学技術文書電子化システムの研究 by 鈴木 昌和; SUZUKI Masakazu
4.
Mathematical Symbol Recognition with Support Vector Machines by Malon, Christopher; Uchida, Seiichi; 内田, 誠一; Suzuki, Masakazu; 鈴木, 昌和
7.
Databases of Mathematical Documents by Suzuki, Masakazu; 鈴木, 昌和; Malon, Christopher; Uchida, Seiichi; 内田, 誠一