重さ[g]

はじめてのパターン認識
第1章
第4グループ
平田翔暉
パターン認識
• パターン認識
o 観測されたパターンを、あらかじめ定められ
たクラスに分類すること
• クラス
o 硬貨:1円玉、5円玉、10円玉、50円玉、
100円玉、500円玉
o アルファベット:26種類
o 数字:10種類
パターン認識
• 例:自販機の硬貨認識装置
パターン認識
• 例:自販機の硬貨認識装置
重さ
穴の有無
透磁率
サイズ
パターン認識
• 例:自販機の硬貨認識装置
30.0
サイズ[mm]
28.0
26.0
24.0
22.0
20.0
18.0
0.0
2.0
4.0
重さ[g]
6.0
8.0
パターン認識
• 例:自販機の硬貨認識装置
30.0
500円玉
サイズ[mm]
28.0
26.0
10円玉
24.0
100円玉
22.0
50円玉
20.0
18.0
0.0
2.0
4.0
重さ[g]
6.0
8.0
パターン認識の流れ
特徴ベクトル
識別クラス
識別対象
サイズ
10円
10円玉 特徴抽出
識別規則
重さ
50円
50円玉
透磁率
100円
100円玉
穴の有無
500円
500円玉
…
識別不能
特徴ベクトル・・・特徴を数値化して並べたベクト
ル
特徴抽出・・・識別に必要な特徴量を測定すること
識別規則・・・クラスに分類するための規則
識別規則の学習
識別規則を作成するためには、入力データとその
クラスを対にした多くの事例を使って入力データ
とクラスの対応関係を学習する必要がある。
この事例のことを学習データと呼ぶ。
パターン認識の使用例
•
•
•
•
•
•
硬貨や紙幣の認識
音声認識
文字認識
顔画像認識
指紋や虹彩から個人認証
etc…
特徴尺度の分類
定性的特徴
(非数値データ)
定量的特徴
(数値データ)
特徴尺度の分類
名義尺度
定性的特徴
(非数値データ)
順序尺度
間隔尺度
定量的特徴
(数値データ)
比例尺度
特徴尺度の分類
尺度名
説明
名義尺度
分類のための単なる名前。クラスラベル。
名前、住所、電話番号、単語など。
順序尺度
順序関係を表す。アンケートの5段階評価、「大中小」、
「優良可」、「男女」など。
間隔尺度
等間隔の単位で測られた量。
原点0はあっても、0でも何もないわけではない。
試験の成績、摂氏・華氏の温度、年月など。
比例尺度
原点が定まっている量。
身長、体重、絶対温度、年齢など。
定性的な特徴の表現方法
非数値データである定性的な特徴を計算機上で扱
うために符号を用いる
2クラス → 「0と1」や「-1と+1」など
Kクラス → K個の2値変数(ダミー変数)で符号化
「大中小」のダミー変数
𝛽 = (𝛽1 , 𝛽2 , 𝛽3 )𝑇 による
表現例
特徴ベクトル空間
特徴ベクトル空間とは、特徴ベクトルによって貼られた
空間のこと
特徴ベクトル空間
特徴ベクトル空間とは、特徴ベクトルによって貼られた
空間のこと
16×16=256個の画素値からなる手書き文字画像データの
場合、256次元のベクトルになり、1枚の画像データが
256次元ベクトル空間中の1点を指すことになる。
次元の呪い
• 次元の呪い
o 学習に必要なデータが、次元の増加とともに
指数関数的に増大すること
1次元空間
2次元空間
3次元空間
高次元超立方体
• 𝑑次元超立方体の性質
o 中心から頂点までの距離
o 中心から面までの最短距離
1
2
:
:
𝑑
1
2