研究デモ　－　目の「見え」を数値化する！

テーマ名：　目の「見え」を数値化する！
　　　　　　　－AAMを用いた目の自動構造抽出－

発表論文

MIRU 2006 (予稿 (PDF 1.62MB)、ポスター(PDF 3.37MB, PNG 568KB)

研究の目的と着想

目の運動（まばたき、表情）による各部位（上眼瞼（まぶた）、下眼瞼、眼瞼裂）の動きを時系列に追跡することを目的とする。生まれつき細い目なのか、目の運動の結果細い目になったのかは、１枚の画像からは判断できない。したがって、「平静の顔である」とわかっている顔画像１枚で生まれつきの目の構造（二重の厚みと濃さ、瞳のサイズと色、下まぶたの膨らみ）を取得し、残りの画像列では、この構造に基づいた目の運動追跡を行う。ここでは目の構造を取得する、すなわち目の生まれつきの“見え”を数値化する研究を紹介する。

AAMの構築

入力は頭部運動追跡によって得られる頭部運動正規化画像列と顔特徴点（眉毛両端点、目両端点）である。この顔特徴点４点から、次の目の各部位の領域を決める。

部位	上眼瞼	眼瞼裂	下眼瞼
領域の構成点列	眉毛下端５点＋上眼瞼下端８点、計１３点	上眼瞼下端８点＋下眼瞼上端１１点、計１９点	下眼瞼上端１１点＋それらから下眼瞼上端の幅の半分の長さ下りた点１１点、計２２点
三角メッシュ化

これを様々な構造の目を撮像したデータすべてについて用意し、これを学習データとして AAM (Active Appearance Model) [Cootes, Stegmann]を構築する。

まず、領域の構成点列の座標を並べたベクトル x を学習データすべてを使って主成分分析し、次式のように平均形状（）とそこからの分散の和で表現する（は大きい順にソートした固有値に対応する固有ベクトルを列ベクトルとする行列で、形状モデルと呼ぶ）。

次に、すべての学習データを平均形状にワープ（対応する三角パッチ間でアフィン変換）したテクスチャパターンgを同様に主成分分析し、次式のように平均テクスチャ（）とそこからの分散の和で表現する（はテクスチャモデル）。

「目のこの位置は常に明るい」といった位置とテクスチャの間の相関があることから、形状パラメータとテクスチャパラメータをさらに主成分分析し、次式のように表現する（は単位を正規化する行列、QはAAM）。

b=(W_s*b_s b_g)T=Q*c

次の表に、各部位の形状モデル、テクスチャモデル、AAMのそれぞれについて、累積寄与率90%を超える次元数を示す。また第１、第２主成分軸上を固有値の平方根の－３倍から３倍まで変化させた時のAAMを示す。この結果は、20次元程度のcを決めれば、目領域の形状とテクスチャの両方を生成できることを示している。

クリックすると動画が見られます：

部位	上眼瞼	眼瞼裂	下眼瞼
形状モデル	4次元	2次元	5次元
形状モデル	1st 2nd	1st 2nd	1st 2nd
テクスチャモデル	12次元	16次元	14次元
テクスチャモデル	1st 2nd	1st 2nd	1st 2nd
AAM Q	17次元	19次元	20次元
AAM Q	1st 2nd	1st 2nd	1st 2nd