<博士論文>
クラスタリングによる視点に不変なパターン認識の学習
作成者 | |
---|---|
本文言語 | |
学位授与年度 | |
学位授与大学 | |
学位 | |
学位種別 | |
出版タイプ | |
アクセス権 | |
JaLC DOI | |
関連URI | |
概要 | 近年,情報化社会の進展に伴って様々な分野で高度な情報処理が求められるようになり,パターン認識技術への要求が高まっている。その中でも視覚情報に基づく認識処理は,今後,更に重要になってくるものと思われる。視覚情報に基づく物体認識においては,視点の変化に伴う画像の変化によらずに個々の物体を識別する機能が求められる。この視点不変性を説明するモデルがこれまでにいくつか提案されているが,生体の行う学習が一般...に教師なし学習であるのに対して,従来のモデルは教師ありで学習が行われる点が不十分であった。そこで本論文では,教師なし学習の典型的な手法であるクラスタリングに基づいて視点に不変なパターン認識のモデル化を行う。 本論文は,視覚情報に基づく物体認識における視点不変性のモデル化に関する研究をまとめたものであり,7章から構成されている。 第1章では,本研究の背景と目的を述べて本論文の構成と概要を示す。 第2章では,視点に不変なパターン認識の基礎としてフィードバック付きのマルチモーダルパターン認識のモデルを提案し,ベイズ識別則に基づく識別法とEMアルゴリズムによる教師なし学習法を提案し,最尤推定によるマルチモーダルパターンの再構成法を示す。例としてマガーク効果を取り上げてフィードバックの効果を調べ,本モデルが心理学や生理学において観測されているトップダウン信号による知覚誘導と似た動作をすることを示す。 第3章では,上記のマルチモーダルパターン認識器を基礎として,認識器の出力であるメンバシップ値をフィードバックすることによって時間的あるいは空間的な文脈情報を取り入れたパターン認識器を提案し,最尤推定に基づく教師なし学習法を提案する。時間的な文脈については,簡単な2次元データを用いてそれらがパターンの類似度でなく提示時刻の近接性によってクラスタリングされることを示す。また簡単な画像データを用いて位置不変なパターン認識への応用例を示す。空間的な文脈については,空間データに含まれるノイズの平滑化やあいまいさの低減化やデータの欠落部への充填現象といった空間的な整合化が行われることを示す。また欠落やあいまいさを伴う空間データの例としてランダムドットステレオグラムを取り上げて視差の推定を行う。 第4章では,上記の時間的な文脈に基づくパターン認識器を視点に不変なパターン認識に応用する。視点が時間的に変化する時系列データをパターン認識器に提示することにより,明示的に教師信号を与えることなく時間的な文脈に基づいて視点に不変なパターン認識器が構成されることを示す。例として人の顔画像を用いて顔の向きによらない個人識別を行い,このパターン認識器を構成している各ニューロンが,生理学において観測されている顔の向きによらずに顔に応答するニューロンと顔の向きに選択的に応答するニューロンとよく似た応答をすることを示す。またロバストなクラスタ分布を用いることにより,学習時や識別時に混入する外れ値の画素を棄却でき,時間的な予測による注視に似た認識処理が得られることを示す。例として3次元物体の画像からの注視領域の抽出を行う。 第5章では,重み付きグラフによって表される点データの集合からファジークラスタを逐次に抽出する方法を提案する。データは各枝と接点が重みを持つ完全無向グラフで表され,各データのクラスタへのメンバシップ値は隣接行列の第1固有ベクトルとして求まる。各データの残存率を隣接行列の要素に乗じることによって抽出済みのクラスタを取り除きながら順にクラスタを抽出していく。抽出処理は抽出したクラスタの大きさに基づき重要なクラスタがなくなった時点で終了する。グレイスケール画像のセグメンテーションを例として本方法と従来法との比較を行い,性能を検証する。またカラー画像からの肌色領域の抽出への応用例を示す。 第6章では,点パターンマッチングに基づく視点に不変な平面物体の認識法を提案する。平面物体の透視射影像は非線形な変形を受けるが,視点の変化が小さいときは弱透視投影などの線形な射影で近似できることを利用して,広範囲の視点から得られる多数の透視射影像を少数個の代表的な視点の透視射影像で近似表現して視点に不変な認識を行う。まずアフィン変換の正規化と従来の合同パターンのマッチング法を組み合わせたアフィン変換に不変な点パターンのマッチング法を示し,次にマッチングの結果に基づいて点パターン間の距離を測り,第5章のクラスタの逐次抽出法により各物体の代表画像を求め,最近傍識別により個々の平面物体を識別する。平面物体の透視射影像の簡単な例を用いて識別を行った結果を示す。またアフィン変換よりも狭いクラスである相似変換に制約される画像群に対する同様の認識法を提示する。 第7章では,本研究で得られた成果をまとめて今後の課題を述べる。続きを見る |
目次 | 目次 1 序論 2 クラスメンバシップフィードバックをもつマルチモーダルパターン識別器 3 メンバシップフィードバックによる文脈伝搬 4 時間的な文脈に基づく視点に不変なパターン認識器の学習 5 グラフスペクトル法による逐次ファジークラスタ抽出 6 点パターンマッチングに基づく平面物体の視点に不変な認識 7 結論 |
詳細
レコードID | |
---|---|
査読有無 | |
報告番号 | |
授与日(学位/助成/特許) | |
部局 | |
登録日 | 2013.07.09 |
更新日 | 2023.12.07 |