修 士 論 文 概 要 書

修 士 論 文 概 要 書
Summary of Master’s Thesis
Date of submission: _1_/_31_/2012 (MM/DD/YYYY)
専攻名(専門分野)
情報理工学専攻
Department
研究指導名
Research guidance
研究題目
Title
情報構造研究
氏 名
Name
学籍番号
Student ID
number
吉永 浩気
CD
5110B134-4
指 導
教 員
Advisor
村岡 洋一
印
Seal
特徴抽出を利用した AR 向けマーカーの作成
1. 研究目的
本研究では拡張現実の為の SURF 特徴量[1]を利用
したマーカー作成について述べる. 街の景観保護の
条例がある京都の様な観光地では, 自由に広告など
を掲示出来ない. しかし,特徴量を利用したマーカー
による拡張現実であれば景観を損なわず, 思い通りの
情報表示が可能となる. そして本研究における情報表
示の舞台となるのは寺・神社・お店といった建築物で,
その殆どには直線部分が存在している. それらをハフ
変換によって検出し, 周辺の特徴量に注目することで
計算コストとデータサイズを抑える手法を提案する.
2. 関連研究: Speeded Up Robust Features(SURF)
本研究の局所特徴量の記述はこのSURF特徴量を用
いて行われる. 局所特徴量とは,画像に対して計算を
行うことで検出される特徴点がもつ64次元の値であ
る. この値は環境変化による影響(明暗・角度など)
を受けにくい性質があり, 基本的にユニークな値が
常に得られるようになっている.
3. 提案手法
3.1. SURF-based Line Marker(SLM)
SLM は図 1 の様に(a)画像のキャプチャ,(b)ハフ変換
による直線検出,(c)線を長軸とした楕円によるマスク画
像の作成,(d)マスクを利用した特徴記述という 4 つのス
テップで構成される.この 1 つの楕円に含まれる特徴量
の集合をマーカーとして用いる.
こに含まれる特徴量の最近傍値を kd-tree を用いて 1
つずつデータベース中から探索する.その近傍値を所
有する DB 中の物体に投票してゆき,最終的に得票数
が最多となったものを回答する.
図2.システム概要図
なお,このシステムにおける速度と精度向上の為,
以下の 2 点の仕様を加えてある.
3.2.1. 得票数の閾値 v の設定
SLM で投票制を行った場合の正答率は 34.9%で,全
領域での場合の 50.9%と比較しても低い結果となった.
これを是正する為,回答時の得票数の分布を見てみる
と図 3 のようになっていた.ここでは青が正解時の得票
数,赤が不正解時の得票数を示している.
図3.得票数の分布
図1.SURF-based Line Marker
3.2. システム概要
この SLM を図 2 の様なシステムで実際に用いる.シス
テムではクエリ画像から SLM を検出し,各 SLM 毎にそ
この図 3 から確認できる様に,正解時の得票数は DB
に登録されていた特徴量の数の一定割合よりも上に,
不正解は下に集中している.この性質を利用し,登録さ
れている特徴量の数の v(v=1/5,1/4,1/3,1/2)以上の
得票のみを有効回答とし,それ以外を無効にするような
閾値 v を設けた.
3.2.2. 同一画像内での直線の傾きのフィルタリング
クエリ画像から検出される直線は図 4 の様に以下の 3
つに大別できる.
① 対象物かつ撮影角度による背景変化がない
② 対象物だが周辺の景色が大きく変化する
③ 誤検出されたもの
表2. 画像 1 枚における平均所要時間
全域利用
SLM
SLM:α=0.02
SLM:α=0.05
SLM:α=0.1
所要時間
1.077[s]
0.664[s]
0.521[s]
0.547[s]
0.563[s]
比較:全域
38.3%↓
51.6%↓
49.2%↓
47.7%↓
比較:SLM
21.4%↓
17.6%↓
15.1%↓
4.3. 精度の評価
閾値(v,α)を設けなかった場合の正答率は 34.9%だ
ったが,閾値 v を設けることでその 55.8%と,全域を用い
るよりも高精度な結果を 得られ た .そし て最高で (v,
α)=(1/2,0.05)の時,正答率は 84.0%となった.
図4.SLM に適切な直線と不適切な直線
一般的な撮影角度から対象物を撮影した場合,①の
様な直線はその傾きが-0.2~0.2[rad]に集中している.
また,この傾きの中でも同一画像内には②や③の直線
も存在するが,①の様な直線の傾きは中央値に密集し
ている為,その周辺の傾きをもつ直線だけを利用するこ
とで適切な直線をフィルタリング出来ると考えられる.
以上の点を踏まえてこのシステムでは,
i.
傾きが-0.2~0.2[rad]以外の直線は除去
ii.
中央値±α(α=0.02,0.05,0.1)以外除去
というフィルタリング機能を実装している.
4.
評価実験
予め DB に 12 の寺社の門のデータを登録しておき,
これを用いて 58 枚の画像で実験を行った.なお,比較
の為に SLM を用いた場合と,1 枚の画像の全領域を利
用した場合で測定を行った.
4.1. データサイズの評価
表 1 は事前に作成した DB のサイズを表している.12
個の情報を登録するには全領域を利用するには
15.5MB も要した.これに対して SLM を用いると1MB に
も満たない.実際のサービスではこの 10 倍以上の数を
登録することを想定すると,SLM は適切なサイズに抑え
ることが出来たと考えられる.
表1. データサイズの比較
サイズ
比較:全域
全域利用
15.5[MB]
SLM
991[kB]
93.5%↓
4.2. 速度の評価
全域を利用した場合と SLM を利用した場合,更に
SLM にフィルタリングを適用した場合での所要時間を
表 2 に示した.SLM のみの場合は全域と比較して 38.3%
短縮し,フィルタリングを適用すると更に 15~20%程度
の短縮に成功している.この点から SLM とフィルタリング
による速度向上が可能であることが実証された.
図5. 閾値(v,α)毎の正答率
5. 結論
全域を用いる場合と比べ,SLM ではデータサイズは
93.5%削減し,所要時間は 51.6%短縮に成功したことに
加え,正答率も 33.1%向上した.正答率は最高でも 84.0%
となっているが,この入力を静止画ではなく動画とした
場合,図 2 のシステムからの回答を複数得られるのを待
って最終回答を行う仕様にすると,その正答率はほぼ
100%を示し,所要時間も最長で 2.6 秒程度であった。以
上の点から,この SLM とそれを用いたシステムは計算コ
ストとデータサイズの削減,及び精度の向上という目標
を達成したといえる.
また,今回は観光支援を目的とする為,DB には予め
適切な SLM を選別して登録した.もしより自由度の高い
利用を目的とした場合,DB に適切な SLM を自動的に
設定出来る仕組みが必要であると考えられる.フィルタ
リングの機能を利用することが 1 つの方法として考えら
れるが,今後サービスとして利用するにはこういった部
分が重要となってくるはずだ.
参考文献
[1] H. Bay, T. Tuytelaars, and V. Gool: Speeded up
robust features, In Proc. ECCV 2006, 2006.
[2] 3日で作る高速特定物体認識システム (7)最近
傍探索の高速化
http://d.hatena.ne.jp/aidiary/20091212/126
0624075