人工知能アルゴリズム探検隊

ご購入はこちら
わりとよく使われるタイプは動かしてガッテン!
ダウンロード・データあります
人工知能アルゴリズム探検隊
第5回
市場調査に使われる多数データのグループ分け「クラスタ分析」
牧野 浩二,北野 雄大
今回紹介する「クラスタ分析」の特徴
属性の分からない多数のデータを,幾つかのグルー
プに分けてくれるクラスタ分析を紹介します.クラス
タ(cluster)とは,
「塊」,「群れ」,「集団」などの意味
があります.
クラスタ分析がよく利用されている場面に市場調査
があります.例えば以下の用途が挙げられます.
1,売り上げ実績や施設の稼働状況からのプロジェ
クトの評価
2,アンケート結果を利用した商品評価
例えばフィットネス・クラブを例に説明します.
・機械をよく使い,かつ風呂にもゆっくり入る人
・ルーム・ランナをよく使い,シャワーだけで済ま
せる人
・機械もルーム・ランナも使い,風呂にゆっくり入
る人
・
風呂だけの人
経験者
第1主成分
0
KF1
KF6
KS5
KF2KS3
xa
KF3
KF4
0.0
左:
Kは経験者
Sは初心者
−0.2 Mは未経験者
SS4 ya
SS5
SF6 SS2SF4
SF3 SS6
SF2SF5
SS3SS1
zt
SF1
SF7
xt
KF5
za
5
初心者
tt
5
KF1
0
KS2
右:
Fは失敗
Sは成功
yt
MF2
MF3
KF6
KS5
KF2 KS3
KF3
KF4
SF3
KF5
−5
MF4
図 1 は連載第 4 回(2016 年 12 月号)で紹介した「主成
分分析」によって,けん玉経験者と初心者の動きを分
類したものです.図 1 のように初心者,未経験者,経
験者が分かれる結果となりました.図 1 の破線は筆者
が単に,初心者,未経験者,経験者に分けるために,
後から書き入れたものです.
図 1 のデータに,今回紹介するクラスタ分析を加え
ると,図 2 のように,プログラムで勝手に,何らかの
グループ群に分割してくれます.図 2 の結果は,1 つ
だけ(MF5)未経験者なのに経験者のデータ群に分割
されていますが,後は見事に振り分けられています.
なお,図 1 はけん玉の技の 1 つ「とめけん」を行った
ときのデータです(写真 1)
.とめけんとは,玉を垂直
に一気に引き上げて剣先にさす技です.けん玉には
1
KS1
KS4
MF5
● 前回の主成分分析と組み合わせると見やすく
分類できる
KS2
KS4
SS5
SS2
SF2 SF5
SS3 SF4
SS1
SF6
SS4
SF1
このデータだけ経験者
に分類された
KS1
-1
SS6
SF7
0
第2主成分
0.2
−5
第2主成分
第2主成分
(分散が1となるようスケール変換済み)
−10
これらを曜日ごと,年齢 / 性別ごとに分ければ,
「土
日の利用者を増やすには,駅前のサラリーマンにビラ
を配ろう」
,
「シャワーの数を増やし女性客を呼び込め
ば機械の稼働率が上がる」などといった対策が打てま
す.
MF2
MF5
MF3
-2
MF4
−0.4
未経験者
-3
MF6
MF1
−0.4
−0.2
0.0
0.2
第1主成分
(分散が1となるようスケール変換済み)
図 1 第 4 回ではけん玉経験者と初心者 / 未経験者の動きを主成分
分析で見やすいように 2 次元プロットした
108
MF6
−10
MF1
-3
-2
-1
0
第1主成分
1
2
図 2 図 1 にクラスタ分析を加えるとグループ分けできる
第 1 回 PICで試せちゃう! なんとなーく思い出せる人工知能記憶装置「アソシアトロン」
(2016 年 9 月号)
第 2 回 パターン認識でよく使われる「サポート・ベクタ・マシン」
(2016 年 10 月号)
第 3 回 ニューラル・ネットの基本学習法「バックプロパゲーション」
(2016 年 11 月号)
2017 年 2 月号