ぬいぐるみゅーじっく:画像認識技術による 日用品の個別認識を利用した

ぬいぐるみゅーじっく:画像認識技術による
日用品の個別認識を利用した音楽操作インタフェース
森 悠紀†
五十嵐 健夫‡
†‡
東京大学大学院情報理工学系研究科 ‡科学技術振興機構さきがけ
†
[email protected]
1. はじめに
日用品を利用して,さまざまな操作を実現可能
‡
[email protected]
で,ID タグを必要とすることなく個別認識が可能
となる.
とする実世界指向のインタフェースは近年注目さ
本稿では,外観を損ねてはいけない日用品の例
れている研究分野である.増井らの MouseField[1]
としてぬいぐるみを取り上げる.提案手法のアプ
は,RFID タグを付けた CD ジャケットを利用して
リケーション例として,ぬいぐるみをステージ上
CD を再生することができる.ところが,RFID タグ
に置くと,対応するテーマソングが流れ出すシス
をあらかじめつけておかなければならない欠点が
テム「ぬいぐるみゅーじっく」を開発し,ぬいぐ
あり,日用品の外観を損なうなどの問題が生じる
るみごとの個別認識が可能なことを実験した.
場合も多い.
コンピュータビジョンの分野では,外界の状況
を,センサを利用することで理解する感知覚能力
の研究が多くなされてきた.中でも,画像を使っ
て外界を認識する視覚能力は,人間の大脳の最も
大きな部分を視覚野が占めることから見ても,最
も重要な情報チャネルといえる.また,コンピュ
ータビジョンを用いるために大掛かりなシステム
が必要だった昔に比べ,近年では比較的安価にシ
ステムを構築できるようになってきた.たとえば,
WEB カメラは安価に手に入れられる視覚情報を入
力するデバイスの一つの例といえる.カメラを利
2. 「ぬいぐるみゅーじっく」システム
2.1. システムの概要
開発システムは WEB カメラを搭載したステージ
からなる(図 1).WEB カメラでステージ上を撮影し
ておき,ステージにぬいぐるみを乗せたときにあ
らかじめ登録されたデータの中から,そのぬいぐ
るみに対応するデータを探し出して,音楽を流す
とともに,ぬいぐるみに関わる情報を画面に出力
する.開発言語は Visual Basic .NET を利用し,動
作テストは Windows XP 上で行った.
用したインタラクションには,Freeman らの手のジ
ェスチャーを利用したもの[2]や,Wren らのリアル
タイムボディトラッキング[3]などがある.
そこで我々は,日用品を利用したインタフェー
スとして,WEB カメラを用いたインタラクション
を提案する.従来では,ID タグなどをつけること
で入力デバイスとしていた日用品を,そのまま利
用するために,WEB カメラによる画像認識を利用
する.たくさんの画像の中から目的の画像を探索
図 1. ぬいぐるみゅーじっくシステム
2.2. ぬいぐるみの登録
ユーザはまずぬいぐるみをシステムに登録する.
する画像パターン認識技術は,画像のヒストグラ
登録したいぬいぐるみをステージに置き,登録ボ
ムを解析する技術[4]や,画像圧縮技術を用いて探
タンを押すと,WEB カメラで画像を撮影する.そ
索する技術[5]などがあり,これらを利用すること
して,そのぬいぐるみのテーマソング(mp3 や wma
Animal Music: A Music Selection Interface using Vision-based
Object Recognition, Yuki Mori and Takeo Igarashi, Graduate
School of Information Science and Technology, The University
of Tokyo, JST PRESTO
フォーマットなどの音楽ファイル)へのパスを登録
する(図 2).さらに,ぬいぐるみに関わる情報(名前,
誕生日,出身地など)も登録できるようになってい
る.ぬいぐるみ 1 匹に対して画像ファイルと情報
データファイルで構成される.
ヒストグラムを用いている.
3. 実
験
ぬいぐるみ 30 個を用いてテストを行った.テス
ト内容はまず,ぬいぐるみの登録をする.その後,
ランダムにぬいぐるみをステージに乗せて,対応
するデータを取得できているかどうかを確認した.
認識率は 93.3%で,リアルタイムに画像認識がほぼ
正確に行われていることがわかる.
図 2. ぬいぐるみの新規登録画面
2.3. 画像探索
4. おわりに
本稿は,日用品を利用して,さまざまな操作を
この節では,システムのステージ上に置かれた
実現可能とする実世界指向のインタフェースとし
ぬいぐるみが,登録された中のどのぬいぐるみな
て,WEB カメラを用いたインタラクションを提案し
のかを探索するためのアルゴリズムを述べる.
た.またプロトタイプとして,WEB カメラを用い
システムを立ち上げたときにあらかじめ,背景の
て画像探索をし,ぬいぐるみに対応する音楽を流
ヒストグラムを計算しておく.WEB カメラから入
す「ぬいぐるみゅーじっく」システムを開発し,
力される画像のヒストグラムが背景のヒストグラ
実験した.コンピュータビジョンの技術を利用す
ムと変化が起きたときに,「ぬいぐるみが置かれ
ることで,ぬいぐるみに ID タグなどをつけること
た」とシステムは認識し,画像探索を開始する.
なく,個々のぬいぐるみを認識することができた.
画像探索方法は,WEB カメラで撮影している画像
今後,画像認識アルゴリズムの改善によりさらな
(探索したいぬいぐるみの画像)の RGB ヒストグラ
る性能の向上が期待できるため,ぬいぐるみ以外
ムを計算し,登録されているぬいぐるみの画像の
の日用品を用いたインタラクションに関しても検
RGB ヒストグラムと比較する.ぬいぐるみの背景
討していく.
にはシステムの壁紙が写っているため,背景との
切り出しなど行う必要はない.登録されている画
像の中で探索画像との評価関数が最小のものを今
置かれているぬいぐるみの登録画像として,その
画像と対応するデータファイルを取り出す.デー
タファイルに書き込まれている内容から,音楽フ
ァイルの URL をたどって音楽を再生するとともに,
ぬいぐるみの情報を表示する(図 3).ぬいぐるみを
ステージから下ろしたとき,もしくは明示的に停
止ボタンを押したときに音楽は停止する.ぬいぐ
るみをステージから下ろしたかどうかの判別にも
参考文献
[1] Toshiyuki Masui, Kouzi Tsukada, Itiro Siio. MouseField: A Simple
and Versatile Input Device for Ubiquitous Computing, UbiComp2004,
Springer LNCS3205, pp.319-328, 2004.
[2] William T. Freeman, Michal Roth. Orientation Histograms for Hand
Gesture Recognition. IEEE Intl. Wkshp. on Automatic Face and Gesture
Recognition, Zurich, 1995.
[3] Christopher Wren, Ali Azarbayejani, Trevor Darrell, Alex Pentland.
Pfinder: Real-Time Tracking of the Human Body. IEEE Transactions on
Pattern Analysis and Machine Intelligence. vol 19. no 7. pp 780-785,
1997.
[4]川西 隆仁, 前田 英作, 村瀬 洋. 色ヒストグラムを用いた実
環境物体探索に関する一検討, 電子情報通信学会春期全国大会,
1999 年.
[5] Takanori Yokoyama, Toshinori Watanabe, Hisashi Koga. Image
Retrieval Exploiting the Similarity of Vectorized Fractal Code Sets, Joint
2nd International Conference on Soft Computing and 5th International
Symposium on Advanced Intelligent Systems (SCIS&ISIS 2004), Sep.
図 3. ぬいぐるみを探索した結果
23, 2004.