Scikit-learn ゼミ

Scikit-learn ゼミ
1.4.2 Nearest Neighbors Classfication
新納浩幸
K-NN 法
識別対象のテストデータに対して、
距離の近い順に k 個の訓練データを選択
それらのラベルの多数決で識別クラスを決める
K=3
テストデータ
識別クラス
K-NN 法（２）
識別対象のテストデータを中心にして、
半径 r の円内の訓練データを選択
それらのラベルの多数決で識別クラスを決める
K=3
テストデータ
r
識別クラス
K-NN 法の特徴
・K の適切な値はデータに依存、大きければノイズが
減るが、識別の境界がゆるくなる
・訓練データが一様でないときは、半経 r の方の k-NN 法
の方が better
・k-NN 法は「次元の呪い」の影響が小さい
・選択したデータに重みをつけるやりかたもある
scikit-learn の提供関数
KNeighorsClassifier
近いもの k 個
RadiusNeighorsClassifier
半径 r 内のデータ

Download Report

2015年1月 - 一般社団法人日本アルミニウム協会

Scikit-learn ゼミ

2015年1月 - 一般社団法人日本アルミニウム協会

平成27年6月大学院博士課程修了予定者論文発表会

統計的機械学習

scikit-‐learn ゼミ

参考文献

Untitled

expydoc.com

Your ExpyDoc

Scikit-learn ゼミ

2015年1月 - 一般社団法人 日本アルミニウム協会

平成27年6月大学院博士課程修了予定者論文発表会

統計的機械学習

scikit-‐learn ゼミ

参考文献

Untitled

expydoc.com

Your ExpyDoc

2015年1月 - 一般社団法人日本アルミニウム協会