<博士論文>
輪郭線情報とテクスチャ情報の統合による画像識別に関する研究

作成者
指導教員等
本文言語
学位授与年度
学位授与大学
学位
学位種別
出版タイプ
アクセス権
概要 近年、電子技術のめざましい進展に伴い、計算機を用いた画像の識別に関する研究とその産業への応用が盛んに行われている。 画像識別を行なうには画像から特徴を抽出する必要があるが、識別結果は抽出された特徴の性質に大きく左右されるので、特徴を適切に取り出すことが重要である。画像の特徴を表す有効な情報として、その形状に関する情報及び模様に関する情報とがある。形状は多くの場合輪郭線で表され、通常閉曲線となる。画...像から輪郭線を抽出・記述して、その性質を把握する方法はこれまでにも多くの研究がなされており、実用的な種々の提案もなされている。模様は多くの場合テクスチャとして捉えられる。テクスチャの解析は、画像処理の基本的なものの一つとして、これまで多くの研究がなされており、最近はリモートセンシング画像や医用画像の識別、更には3次元物体識別等において積極的に利用されている。 輪郭線やテクスチャは、それぞれ画像の識別において重要な情報である。しかしながら、更にこれら両者を統合して識別を行なえば、より良い結果を得ることができることもいくつかの例で明らかになっている。輪郭線情報とテクスチャ情報の統合にとどまらず、異質で有効な複数の情報を統合して識別を行うという研究は、今後より広く進められていく必要がある。  本論文は、輪郭線情報とテクスチャ情報との統合による画像識別に関する研究結果をとりまとめたものであり、7章から構成されている。  第1章は序論であり、本研究の背景と扱っている問題を示し、あわせて論文の概要について述べる。  第2章では、輪郭線情報の種々の記述方法に関して概説し、これらの方法の性質を詳細に分析する。この結果、P型記述子から得られるパワー・スペクトルを用いる方法が、画像の平行移動、拡大・縮小及び回転に対して不変であり、更に輪郭線の始点の位置の移動に対しても不変であることから、最も有効な方法であることを明らかにする。また、P型記述子を精度良く求めるためには輪郭線を等辺多角形で近似する必要があるので、その方法についても詳述し、特にEPACに基づく方法は、輪郭線が再生可能であり、かつディジタル化誤差の影響を受けにくいため、きわめて有用な等辺多角形近似法であることを明らかにする。  第3章では、輪郭線情報を安定して抽出する方法としてロバストエネルギー最小化による輪郭線保存平滑化法を述べる。輪郭線情報による識別において、大域的な形状の情報の方が局所的な情報よりも重要な場合が多い。また、輪郭線の等辺多角形近似において、平滑化された輪郭線の方が等辺多角形近似アルゴリズムが収束しやすい。そこで、大域的な情報を損なわず、ノイズ等の不要な局所情報を除き輪郭線を平滑化する方法として、ロバストエネルギー最小化による方法を提案し、この方法が、特に平滑化能力とアルゴリズムの扱い易さとにおいて、きわめて有効であることを明らかにする。更に、具体的なエッジ平滑化の例としてノイズの混入した波形データの平滑化実験をも行い、種々の方法と比較した結果、本法が最も有用であることを実証する。  第4章では、テクスチャ情報の種々の記述方法に関して、構造的な解析法と統計的な解析法とに大別して概説し、これらの方法の性能を詳細に分析する。この結果、濃度共起行列による方法が、平行移動や45度単位の回転に対して不変であり、更に画像の一様性やコントラスト等の多くの性質を表すことが可能であることから、最も有効な方法であることを明らかにする。  第5章では、輪郭線情報とテクスチャ情報とを統合して識別を実行するシステムとして、異種情報の統合が可能な回路である階層型ニューラルネットワークについて、その基本的な性質を示すとともにそれによる輪郭線情報とテクスチャ情報との統合方法を具体的に述べる。  第6章では、魚画像を対象として行った、輪郭線情報とテクスチャ情報との統合による画像識別実験の結果を示す。本実験では、第2章から第5章までに述べた方法をすべて適用する。輪郭線情報はP型記述子のパワースペクトルの低周波成分であり、テクスチャ情報は濃度共起行列の要素である。両者の情報は3層ニューラルネットワークで統合される。魚画像は標準画像と標準画像の回転、サイズ変換画像で構成され、それらの半分をニューラルネットワークの学習用の画像とし、残りの半分を識別テスト用の画像とする。情報の統合回路はネットワークの学習過程で形成される。輪郭線情報とテクスチャ情報とを統合して行った画像識別結果が、両者の情報を個別に用いた場合に比べて格段に良いことを明らかにし、両者の情報の統合がきわめて有用であることを実証する。  第7章では結論として、本研究で得られた結果を要約するとともに、今後の課題を述べる。
Although the contour information and the texture information of an image are frequentry used separately, a simulataneous use of the two will lead to more successful results. This thesis describes studies on image discrimination by unifying contour and texture information, which is consisted of 7 chapters. Chapter 1 is an introduction, which describes background and problems of studies, and summarizes this thesis. In chapter 2, various methods which describe contour information are examined. As the result, we show that the power spectrum obtained by P-type Fourier descriptor is most efficient. Furthermore, we show that to extract P-type descriptor accurately, the equilateral polygon approximation of contour is needed, and propose an algorithm for equilateral polygon approximation (EPAC). In chpater 3, the edge smoothing alorithm based on the minimized robust energy is proposed for stable contour information extraction. In many case, for image discrimination by contour, using global information of a figure is more important than using local one. The proposed algorithm can reduce local noise and can smooth edge of a figure without losing global information. Moreover, an experimental result proves that this algorithm is useful. In chapter 4, various methods which describe texture information are examined. As the result, we show that the co-occurrence matrix is most efficient. In chapter 5, the basic property of the multi layer neural network which unifies contour and texture information to discriminate images is presented. Moreover, the process of unifying two is shown concretely. In chapter 6, an examination of fish images discrimination by unifylng contour and texture information is shown. In this examination, all methods described in chapter 2 to 5 are applied. Contour features are lower components of the power spectrum by P-type descriptor, and texture features are elements of the co-occurrence matrix. Three layer neural network unifies these features and discriminates images. This experimental result clarifies that the discrimination rate obtained in case of the simultaneous use of two is much better than rates obtained in case of the sole use of two respectively. This shows that the two kinds of information is proved extreme efficient for figure discrimination. Chapter 7 is a conclusion, which summarizes the result of studies and presents future subjects.
続きを見る
目次 目次 第1章 序論 第2章 等辺多角形近似による輪郭線特徴の抽出 第3章 ロバストエネルギー最小かによる輪郭線保存平滑化 第4章 種々のテクスチャ特徴による画像解析 第5章 ニューラルネットワークによるパターン識別 第6章 輪郭線情報とテクスチャ情報の統合による魚画像の識別 第7章 結論 謝辞 参考文献 図目次 表目次

本文情報を非表示

K032 pdf 16.6 MB 189  

詳細

レコードID
selfDOI
査読有無
関連情報
報告番号
授与日(学位/助成/特許)
受理日
部局
所蔵場所
所蔵場所
所在記号
注記
登録日 2013.07.09
更新日 2018.01.17