修 士 論 文 概 要 書 Summary of Master’s Thesis Date of submission: _1_/_31_/2012 (MM/DD/YYYY) 専攻名(専門分野) 情報理工学専攻 Department 研究指導名 Research guidance 研究題目 Title 情報構造研究 氏 名 Name 学籍番号 Student ID number 吉永 浩気 CD 5110B134-4 指 導 教 員 Advisor 村岡 洋一 印 Seal 特徴抽出を利用した AR 向けマーカーの作成 1. 研究目的 本研究では拡張現実の為の SURF 特徴量[1]を利用 したマーカー作成について述べる. 街の景観保護の 条例がある京都の様な観光地では, 自由に広告など を掲示出来ない. しかし,特徴量を利用したマーカー による拡張現実であれば景観を損なわず, 思い通りの 情報表示が可能となる. そして本研究における情報表 示の舞台となるのは寺・神社・お店といった建築物で, その殆どには直線部分が存在している. それらをハフ 変換によって検出し, 周辺の特徴量に注目することで 計算コストとデータサイズを抑える手法を提案する. 2. 関連研究: Speeded Up Robust Features(SURF) 本研究の局所特徴量の記述はこのSURF特徴量を用 いて行われる. 局所特徴量とは,画像に対して計算を 行うことで検出される特徴点がもつ64次元の値であ る. この値は環境変化による影響(明暗・角度など) を受けにくい性質があり, 基本的にユニークな値が 常に得られるようになっている. 3. 提案手法 3.1. SURF-based Line Marker(SLM) SLM は図 1 の様に(a)画像のキャプチャ,(b)ハフ変換 による直線検出,(c)線を長軸とした楕円によるマスク画 像の作成,(d)マスクを利用した特徴記述という 4 つのス テップで構成される.この 1 つの楕円に含まれる特徴量 の集合をマーカーとして用いる. こに含まれる特徴量の最近傍値を kd-tree を用いて 1 つずつデータベース中から探索する.その近傍値を所 有する DB 中の物体に投票してゆき,最終的に得票数 が最多となったものを回答する. 図2.システム概要図 なお,このシステムにおける速度と精度向上の為, 以下の 2 点の仕様を加えてある. 3.2.1. 得票数の閾値 v の設定 SLM で投票制を行った場合の正答率は 34.9%で,全 領域での場合の 50.9%と比較しても低い結果となった. これを是正する為,回答時の得票数の分布を見てみる と図 3 のようになっていた.ここでは青が正解時の得票 数,赤が不正解時の得票数を示している. 図3.得票数の分布 図1.SURF-based Line Marker 3.2. システム概要 この SLM を図 2 の様なシステムで実際に用いる.シス テムではクエリ画像から SLM を検出し,各 SLM 毎にそ この図 3 から確認できる様に,正解時の得票数は DB に登録されていた特徴量の数の一定割合よりも上に, 不正解は下に集中している.この性質を利用し,登録さ れている特徴量の数の v(v=1/5,1/4,1/3,1/2)以上の 得票のみを有効回答とし,それ以外を無効にするような 閾値 v を設けた. 3.2.2. 同一画像内での直線の傾きのフィルタリング クエリ画像から検出される直線は図 4 の様に以下の 3 つに大別できる. ① 対象物かつ撮影角度による背景変化がない ② 対象物だが周辺の景色が大きく変化する ③ 誤検出されたもの 表2. 画像 1 枚における平均所要時間 全域利用 SLM SLM:α=0.02 SLM:α=0.05 SLM:α=0.1 所要時間 1.077[s] 0.664[s] 0.521[s] 0.547[s] 0.563[s] 比較:全域 38.3%↓ 51.6%↓ 49.2%↓ 47.7%↓ 比較:SLM 21.4%↓ 17.6%↓ 15.1%↓ 4.3. 精度の評価 閾値(v,α)を設けなかった場合の正答率は 34.9%だ ったが,閾値 v を設けることでその 55.8%と,全域を用い るよりも高精度な結果を 得られ た .そし て最高で (v, α)=(1/2,0.05)の時,正答率は 84.0%となった. 図4.SLM に適切な直線と不適切な直線 一般的な撮影角度から対象物を撮影した場合,①の 様な直線はその傾きが-0.2~0.2[rad]に集中している. また,この傾きの中でも同一画像内には②や③の直線 も存在するが,①の様な直線の傾きは中央値に密集し ている為,その周辺の傾きをもつ直線だけを利用するこ とで適切な直線をフィルタリング出来ると考えられる. 以上の点を踏まえてこのシステムでは, i. 傾きが-0.2~0.2[rad]以外の直線は除去 ii. 中央値±α(α=0.02,0.05,0.1)以外除去 というフィルタリング機能を実装している. 4. 評価実験 予め DB に 12 の寺社の門のデータを登録しておき, これを用いて 58 枚の画像で実験を行った.なお,比較 の為に SLM を用いた場合と,1 枚の画像の全領域を利 用した場合で測定を行った. 4.1. データサイズの評価 表 1 は事前に作成した DB のサイズを表している.12 個の情報を登録するには全領域を利用するには 15.5MB も要した.これに対して SLM を用いると1MB に も満たない.実際のサービスではこの 10 倍以上の数を 登録することを想定すると,SLM は適切なサイズに抑え ることが出来たと考えられる. 表1. データサイズの比較 サイズ 比較:全域 全域利用 15.5[MB] SLM 991[kB] 93.5%↓ 4.2. 速度の評価 全域を利用した場合と SLM を利用した場合,更に SLM にフィルタリングを適用した場合での所要時間を 表 2 に示した.SLM のみの場合は全域と比較して 38.3% 短縮し,フィルタリングを適用すると更に 15~20%程度 の短縮に成功している.この点から SLM とフィルタリング による速度向上が可能であることが実証された. 図5. 閾値(v,α)毎の正答率 5. 結論 全域を用いる場合と比べ,SLM ではデータサイズは 93.5%削減し,所要時間は 51.6%短縮に成功したことに 加え,正答率も 33.1%向上した.正答率は最高でも 84.0% となっているが,この入力を静止画ではなく動画とした 場合,図 2 のシステムからの回答を複数得られるのを待 って最終回答を行う仕様にすると,その正答率はほぼ 100%を示し,所要時間も最長で 2.6 秒程度であった。以 上の点から,この SLM とそれを用いたシステムは計算コ ストとデータサイズの削減,及び精度の向上という目標 を達成したといえる. また,今回は観光支援を目的とする為,DB には予め 適切な SLM を選別して登録した.もしより自由度の高い 利用を目的とした場合,DB に適切な SLM を自動的に 設定出来る仕組みが必要であると考えられる.フィルタ リングの機能を利用することが 1 つの方法として考えら れるが,今後サービスとして利用するにはこういった部 分が重要となってくるはずだ. 参考文献 [1] H. Bay, T. Tuytelaars, and V. Gool: Speeded up robust features, In Proc. ECCV 2006, 2006. [2] 3日で作る高速特定物体認識システム (7)最近 傍探索の高速化 http://d.hatena.ne.jp/aidiary/20091212/126 0624075
© Copyright 2024 ExpyDoc