<博士論文>
オンラインマルチストローク文字の認識に関する研究

作成者
論文調査委員
本文言語
学位授与年度
学位授与大学
学位
学位種別
出版タイプ
アクセス権
JaLC DOI
概要 本論文は,漢字のような多画文字を対象としたオンライン文字認識に関する.オンライン文字認識とは,タブレット上のペン先位置の時系列として入力された文字データを対象とした認識手法である. 1960年代から現在に渡って50年の歴史を持つが,昨今のTablet PCを代表とする電子機器の普及によって応用は急激に広がっている.例えば,Tablet PCやPDA(電子手帳の類)では,キーボードに変わる文字入力手...段としてオンライン文字認識が利用されている.また,そこで培われた技術は,タブレットやタッチパネルを具備したゲーム機器類や携帯端末のためのマンマシンインタフェースの基盤技術として活用されている. オンライン文字認識に関する様々な技術課題のうち,本論文では筆順変動問題に取り組む.同問題は,時系列データを扱うオンライン文字認識に独特な問題である.すなわち,筆順が変わると,見かけ上同じような文字形状であっても,時系列的には一部のデータが通常とは異なる部位に移動してしまう.その結果,例えば時系列順に沿ったマッチングを行うと,その字形の標準的な時系列データと大きく異なってしまい,誤認識を生ずる.例えば「女」の標準データは「く」「ノ」「一」の順であるが,もし入力が「一」「く」「ノ」の順に筆記されたとすれば,両者を単純に照合しても,全く異なる文字と判断されてしまう.本論文の主たる貢献は,(1)この筆順変動問題への対処法の調査・分類および実験的比較検討,ならびに(2)部首レベル処理の導入による計算量低減法の提案,の2点に集約される.第一の貢献に関する具体的検討内容は以下の通りである.まず従来の筆順変動対処法を網羅的に調査,分類した.そしてそれら分類の上で最も精度的に期待できるものとして,画対応探索法の重要性を強調した.ここで画対応探索法とは,例えば2つの画系列「く」「ノ」「一」と「一」「く」「ノ」の間に適切な対応関係を定める方法を指す.基盤となる数学的定式化並びに解探索原理が全く異なる5種類の画対応探索法 ― cube search (CS), bipartite weighted matching (BWM), individual correspondence decision (ICD), stable marriage (SM), deviation-expansion model (DE) ― を特に採り上げ,それらの原理を比較,吟味した.その上で,それらの詳細な計算量および精度の比較を,教育漢字を対象とした認識実験を通して行った.その結果,原理的に大局的最適化能力を持つCSとBWMが最も高い画対応精度を示し,相対的な優位性を確認した.また、計算量の側面においては,BWM,ICD,SMに優位性があることを実証した.加えて,高速化のために枝刈りを組み込んだCSは,原理的には近似解しか得られないものの,現実的には精度と速度を両立可能なことを実験により示した.第二の貢献に関する具体的検討内容は以下の通りである.この部首レベル処理の着想は,ほとんどすべての筆順変動が,部首内,もしくは部首単位で起こりうることに基づく.すなわち例えば「桜」に起こる筆順変動は,「木」内部や「女」内部で起こるもの,および「木」全体が「ツ」「女」の後に書かれるといった部首単位のものが主要であり,「木」と「ツ」にまたがったような筆順変化は少ない.このような制約を上記の画対応探索法に組み込むことで,解探索空間を圧縮でき,結果的に計算量を低減できる.具体的には,こうした制約との相性が良いCSに基づいた手法を提案し,実際の認識結果を通して,速度面での改善が得られたことを実証している.さらに,副次的に精度の向上も図れていることを示している.
This thesis copes with the issues of online multi-stroke character recognition, and focuses on two topics related to the recognition task: (i) This thesis reviews the approaches for solving the stroke-order variation problem, and conducts a comparative comparison for clarifying the relative superiority of five methods of stroke correspondence. The five methods are cube search (CS), bipartite weighted matching (BWM), individual correspondence decision (ICD), stable marriage (SM), and deviation-expansion model (DE). (ii) This thesis proposes a novel method to reduce the time and spatial complexity of CS remarkably, by dividing Kanji character reference pattern into radical reference patterns, and reorganizing the stroke correspondence search graph of CS.
続きを見る
目次 1 Introduction
2 Review of online character recognition
3 Cube search
4 Comparative study of stroke correspondence search methods for stroke-order variation
5 An efficient radical-based algorithm for stroke-order free online Kanji character recognition
6 Conclusion

本文ファイル

pdf 蔡文杰_情報知能工学 pdf 742 KB 330 本文
pdf abstract pdf 137 KB 174  

詳細

レコードID
査読有無
報告番号
学位記番号
授与日(学位/助成/特許)
受理日
部局
所蔵場所
所蔵場所
所在記号
注記
登録日 2013.07.12
更新日 2023.12.08

この資料を見た人はこんな資料も見ています