シーズタイトル 斜めから撮影した文字が読める高速文字認識技術 氏名(所属、役職) 研究責任者:岩村雅一 (大阪府立大学 工学研究科 准教授) コーディネータ :阿部敏郎 (大阪府立大学 地域連携研究機構 シーズ 育成オフィス 副オフィス長) H23 年度採択課題名、 新たな高速化技術と単語辞書の導入による文字利用の高度情報提示 (課題番号) システム (AS232Z01451A) 技術キーワード 情景中文字認識、アフィン不変なテンプレートマッチング 【新技術の概要】 カメラで斜めから撮影した文字を高速に認識す る技術を世界で初めて開発した。この技術は文 字やピクトグラムを 1 秒間に 300 文字程度認識 し、認識と同時に位置と姿勢を推定できる(認 識速度はサーバを利用した場合)。斜めからの撮 影にも頑健で、60°程度まで認識可能である。 ノートパソコンでも実時間動作可能である。 図1はこの技術を用いた新しい情報取得イン タフェースである。これは利用者がカメラを向 けた方向にある単語を認識し、その単語の翻訳 と、単語にあらかじめ関連づけられた画像や音 声を提示するものである。例えば、Hawk という 単語を認識したときには、鷹の画像を表示した 図1 申請者らが開発した文字の関連情報を 即座に提示するシステム (関連情報、デモビデ オ等は http://imlab.jp/camocr/で得られる) り、鷹の鳴き声を再生したりするといった具合 である。このシステムを用いれば、利用者は web ページのリンクをクリックするのと同様の手軽 さで、知りたい情報を入手することができる。 ノートパソコンを使用した場合、1 秒間に約 10 フレーム程度の速度で認識と情報提示を行う事 ができる。 【想定される技術移転】 【視覚障害者の支援】 利用者が街を歩くときに認識装置が常に囲の文 字を認識し続け、重要と判断された情報を画像 や音声等で利用者に伝える 【外国人の支援、教育補助システム、老人のぼ けを防止するシステム】 【従来技術・競合技術との比較】 主な従来技術としては、斜めから撮影した文字 を高速に認識できるが、文字が直線上に並んで 利用者がカメラで指し示した文字の関連情報 (翻訳、問題のヒント、趣味情報、医療情報な ど)が得られる対話システム いることを仮定したものや、様々なレイアウト の文字を認識できるが処理時間がかかるもの等 がある。本手法のように、様々な大きさの文字 や直線上に並んでいない文字列を斜めから撮影 して実時間で認識可能な手法は他にない。 【お問い合わせ先】 大阪府立大学 産学官連携機構 シーズ育成オフ ィス 副オフィス長 工学博士 阿部 敏郎 TEL: 072-254-7943 【本技術に関する知的財産権】 1.国際公開 WO/2010/092952、 「パターン認識装 置」、出願人:大阪府立大学 FAX: 072-254-9874 e-mail: [email protected]
© Copyright 2025 ExpyDoc