パターン認識 - 田中雅博研究室

パターン認識
平成27年度
甲南大学知能情報学部 田中雅博
この資料は、授業で使ったものを一部変えた不完全なも
のです
シラバス
授業内容
• パターン認識は,古くは郵便番号自動読み取りか
ら,最近は個人生体認証や自動運転における
様々な認識に至るまで,我々の生活の随所に入り
込んでいる.しかし,その技術はあまり一般には知
られていない.今後,パソコンに種々のセンサーが
追加されて,パターン認識はさらに身近なものに
なってくると考えられる.
• 本科目では,そのようなパターン認識の応用例を
まず多く示し,そののちに,パターン認識理論の数
学的枠組みを講義するという形をとる.
到達目標
• パターン認識の基礎的概念をしっかり理解し,また,
そこで使われる数学に慣れることが目標である
授業方法
• 基本的にはPowerPointによる講義であり,資料も
大部分は公開する.
授業時間外における学修方法
• 毎回授業にきちんと出席し,復習をすることは必
須である.
• また,身の周りにある技術を各自で調べたりする
課題を与えることもあるので,その際にはきちんと
行うこと
履修条件
• 必須条件ではないが、線形代数や確率などの知
識を必要とする部分があるので、しっかりとそれら
の数学を学んでから履修して欲しい。
成績評価
• レポート1割、中間試験3割、期末試験6割の重みで評価を
行う。
• 中間試験を休む場合は、以下のように配慮する。
• 4回生の就職活動:筆記試験、面接試験の場合、受験する会社等
からの案内文をコピーして提出すること。後日追試を行う。
• 教育実習、介護実習など:その日が実習であることを示す文書を
提出のこと。後日追試を行う。
• 病気の場合:医師の診断書提出。後日追試を行う。自宅療養は、
追試の対象としない。
• 忌引:お通夜、葬儀の日の欠席については、誰のものであるかを
連絡のこと。後日追試を行う。
• 部活の正式試合など:詳細を報告のこと。内容に応じて検討し、認
める場合、後日追試を行う。
• それ以外の理由は認めず、中間試験を0点として扱う。
• 定期試験については、大学の取り扱いルールに従う。
欠席基準
• 定期試験を受験しない者を欠席とする
授業構成
1.
パターン認識とは
2.
自動運転における認識
3.
生体認証の応用
4.
産業用ロボットにおける認識
5.
音声・文字認識
6.
カメラによる画像認識技術
7.
人工知能
8.
パターン認識をするための数学モデル
9.
学習はどうやって行うのか
10.
認識系と特徴空間
11.
最近傍法
12.
線形識別関数
13.
パーセプトロン
14.
ニューラルネットワークとは
15.
まとめ
教科書
• 使用しない.
当研究室で今まで作ってきた認
識システム(の一部)
• セキュリティ
• 署名認識システム
• 遊びのシステム
• だるまさんがころんだ
• 百人一首
• あっちむいてほい
• 健康増進、安心のためのシステム
• ラジオ体操採点システム
• 呼吸数検知システム
• 障害物検知システム
• 移動ロボットKoRo
KoRo (和田研と合同で製作)
• パターン認識の応用を中心に研究
• KoRoの主な機能
• 自分の位置を認識して動く
• 動きながら周りのものや動いている人などを判別
この夏、生まれ変わります!
オープンキャンパスで来客と遊ぶ
図書館入り口で案内
(主として学生がプログラミング)
KoRoの新しい機能(予定)
• Open Campusのときに、図書館前などで活躍
• 対話して、言われた場所(たとえば8号館)に自分で動いて
行って帰る
• クイズ(KoRoが問題を出して、それに人間が答える)
• ぶらぶら動いて、愛想を振りまく
• ある一定の場所に集まっている人の数を数える
• 番号札が立っていて、そこに書かれている番号の順番に移
動する
• などなど
• それ以外のとき
• 図書館入り口に場所をとって(移動はしない)、音声での対
話と図書館の案内
本講義の特徴
• 「パターン認識」:比較的一般的に語られる言葉
一方、
• パターン認識理論=数学的枠組み
• ほとんどの「パターン認識」の教科書は非常に数
学的初学者には難解。
そこで、
• 本講義では、パターン認識についての理解を深め、
その後に少し理論を教える。
• 本格的にパターン認識を学び、実システムへ応用
したいと思うひとは、是非田中ゼミで勉強を。
参考書
• 教科書にはしないが,以下の書
籍をベースにした講義の組み立
てである.準備することを勧める.
• 石井他「わかりやすいパターン認
識」,オーム社,2940円
パターン認識のイメージ
識別対象
• 画像
• 音声信号
• 文字列
• その他いろいろ
リンゴかどうか認識
分ける(識別)
画像・音声などの雑多な情報を含むデータの
中から、意味を持つ対象を選別して取り出す
処理
認識内容
物の種類
個人の区別
良否
文字の識別
標識(図)の識別
スパムか否か
その他
パターン認識技術とは
• パターン認識は事象の特徴を認識して体系化して、理解すること
• 認識対象例
• 音声認識
• 文字認識(OCR)
• 画像認識(コンピュータビジョン)
• 人の顔(個人、表情など)
• 図形(線画、立体図など各種)
• 指紋、虹彩などを使った個人認証
• 動作、ジェスチャー
• 手話認識
パターン認識か否か?
手書きの郵便番号
○
声を聞いて話している人を当て
る
○
足音を聞いて人が誰か判断する
○
作業をするために、クラスの学生
を3つのグループに分ける
単純に番号順やランダムなら
能力や特性を見て分けるのであれば
×
△
テレビ映像から、相撲の勝敗を
決した技(寄り切り、押し出し、…)
を決める
○
学生の住所を基に、ラベルを振
る(兵庫県=1、大阪府=2,…)
×
パターン認識としての要素はない
学籍番号でクラス分けする
×
印刷文字をスキャナーで読み取
り(OCR)
○
走っている車の車種を当てる
○
体重計で体重を測る
×
計測
入試を受けに行くとき、朝おかあ
さんが「絶対に受かるよ」という
×
希望あるいは慰めという
写真に写っている野菜の種類を
当てる
○
彼女3人からお嫁さんを決める
×
認識とは言わない
パターン認識の基本形
• If
条件
then これはリンゴである
これはリンゴではない
認識問題によって実に様々。
リンゴかどうかの問題
ここをどうするのか?
アプローチ1
リンゴの直径、色、形などを調べて、条件で絞り込む
アプローチ2
リンゴをたくさん集め、直径、色、形などを覚えておき、
検体が来たら、よく似たものがあるかどうか調べる
画像だけでいいのか、においや重さ、固さなども
調べる必要があるのか?
ある程度、システム設計する人の技量が問われる!
パターン認識の難易
• 大変難しい
• 「ねこ」の写っている写真をネットから集める
• スナップ写真から花の種類を当てる
• これらは、パターン認識の中でも最も難しい種類
• 比較的やさしい
• 顔認証
• 写真の顔の人の名前を10名の中から当てる
アプリでのパターン認識
• Google Goggles
• 画像認識アプリ
• スマホのカメラで撮影
• 識別(有名な絵、ランドマーク、バーコード・QRコード)
• 絵画の認識率は高い
• 翻訳
• サイトへ接続
• 花しらべ(iOS7、有料=700円)
生体認証
• 指紋認証
• 銀行での掌動脈認証(三菱東京UFJ銀行、その他)
• 署名認識
拡張現実(AR; Augmented
Reality)
• 画像を認識し、分かった名前などを画像に重ねて
見せる
ITS; Intelligent Transportation
System
• 車の数をカウント
• 車の種類を判定
• ナンバーを判定(Nシステム)
• これにより、高速道路を通行した車はすべて追跡でき
る
入国管理 US-VISIT
• アメリカ入国時に指紋と顔写真を撮影
1.
2.
3.
4.
5.
右手4本
右手親指
左手4本
左手親指
顔
街角カメラによる顔認識
• 大阪駅ビル 顔認識により人の動きを把握
(2014.4より)→中止
電子投票
• どうやって個人認証を行うか
建物・部屋などの入室管理
スパムメールの判定
• どこを見て「スパム」と判断するのか?
宿題
• 車の自動運転技術について、
• どのような機能が必要か
• いま、実用化に向けてどこまで進んでいるか
• パターン認識と考えられる技術内容はどういうことか
• 以上の内容をそれぞれ項目ごとに調べ、まとめて、次
回の授業の際に提出せよ。
• レポートはWordなどで書く。内容のみならず、レポート
としての形が整っているかどうかも採点の対象。