作成者 |
|
論文調査委員 |
|
|
|
本文言語 |
|
学位授与年度 |
|
学位授与大学 |
|
|
学位 |
|
学位種別 |
|
出版タイプ |
|
アクセス権 |
|
JaLC DOI |
|
概要 |
人が顔を見て如何なる認識あるいは理解をしているかは、認知科学の立場から盛んに取り上げられている。人は顔を見てそれが誰であるかを識別し、またその表情から何を考えているかまで推察することができる。認知科学は、このような顔の持つコミュニケーション機能が、脳において如何に行われているかを解明しようとするものである。 顔を視覚パターンとして捉え、その分類(個人識別)を如何に行っているかだけに限って考えて...も、これは興味深い研究対象である。それは、人が顔を見て個人識別を行うことは、相互に非常によく似た顔という等質なパターンを、個人の独自性を元に分類するという問題だからである。例えば、鼻は中央に1つであるが、その大小・高さ・幅・顔の中での位置などが個人の独自性であり、目は左右に2つであるが、その大小・間隔・顔の中での位置などが個人の独自性である。しかし、一重瞼を二重に整形したり、年齢を重ねしわが増えたり、あるいは髪型が変っても、その独自性は大きく損なわれることはなく、人は個人を識別することが可能であると言われている。すなわち、人が個人を識別するとき、視覚パターンをある意味で概略化し、個人の独自性を巧妙に抽出あるいは強調する過程を経て行っていると考えられる。 脳における視覚パターンの認識においては、対象となるパターンの外形的な形状・輪郭など一次元情報に基づくもの、テクスチャなど二次元情報に基づくもの、さらには奥行きをも含めた三次元情報に基づくものなどが、複合的に行なわれていると考えられる。計算機による顔画像の認識処理においても、横顔の輪郭線形状など一次元情報に基づくもの、正面顔画像など二次元情報に基づくものなど、それぞれは簡単であるが、いくつかの処理を統合することにより単独の場合よりも認識率が向上することが期待できる。 本論文は、人物の横顔と正面顔画像をそれぞれ処理し、かつそれらを統合することによる個人識別に関する研究をまとめたものであり、6章から構成されている。 第1章では、本研究の背景と扱っている問題を示し、あわせて論文の概要について述べている。 第2章では、横顔による個人識別について、横顔輪郭線のP形フーリエ記述子を特徴量とする個人識別法を提案している。P形フーリエ記述子では、輪郭線の概略形状の情報がその低域成分に良く集約されるが、低域成分だけを用いることにより、誤認識の原因となる微細な形状の違いを特徴から排除することが可能である。このP形フーリエ記述子を求めるためには、輪郭線の等辺多角形近似が前提となる。これを、ディジタル曲線上で実行する際には、画素数に基づいて距離を測るという簡便法を用いることがこれまで一般的であり、種々の不都合な減少が起きる。本章では、まずユークリッド距離の意味で厳密に等辺なる方法を提案し、その有効性を実験により示した。次に、この等辺多角形近似法を用いて求めた横顔輪郭線のP形フーリエ記述子のパワースペクトルを特徴とする個人識別の実験を行った。75人の横顔画像を辞書パターンとして用い、約85%の識別率を得た。 第3章では、正面顔による識別について、正面顔画像をプロック化して得られるモザイク画像の濃度値を特徴とする正面顔画像による個人識別法を提案している。目・鼻・口などの個々の器官の形状や位置関係を特徴パラメータとする方法では、表情の違いによりこれらの特徴パラメータが受ける影響は大きく、誤認識は避けられない。また、髪型の違いによって正面顔画像から受ける印象は異なるが、個人の独自性として髪型は本質的ではない。ここでは、これら髪の部分は除き、表情も通常の証明写真を撮影するときのようなものに限った。このような写真に対して、両目を基準点とし、正面顔画像の中心部分を照合領域として切り出した上で、矩形ブロックによるモザイク化を行い、各矩形ブロック内の濃度平均値を特徴とする方法を提案した。この方法による75人の正面顔画像を辞書パターンとして用いた個人識別の実験では、約70%の識別率を得た。 第4章では、横顔画像と正面顔画像の情報を統合して個人識別する方法を提案している。横顔画像による個人識別と正面顔画像による個人識別は、それぞれ独立した特徴を用いている。従って、横顔画像による特徴と正面顔画像による特徴とを統合して識別することにより、識別率の向上が図られることが期待できる。実際、横顔画像と正面顔画像の情報を統合して用いた個人識別の実験では、約95%の識別率を得た。 第5章では、顔画像による個人識別への応用を目的として、複数の特徴を統合するニューラルネットの構成について考察を加え、その上で、ニューラルネットの本質的な機能の1つであるクラスタリング機能について調べている。そこでは同次元層状ニューラルネットを考察の対象とし、いくつかの有用な性質を明かにした。また、その具体的応用としてノイズの加わった文字のクラスタリングの問題をとりあげ、顔画像処理への応用の可能性を示唆した。 第6章では、結論を述べ今後の課題について論ずる。続きを見る
|
目次 |
目次 第1章 序論 第2章 横顔画像による個人識別 第3章 正面顔画像による個人識別 第4章 横顔と正面顔の統合による個人識別 第5章 ニューラルネットによる統合 第6章 結論 謝辞 参考文献 図目次 表目次
|