Data Clustering: A Review A.K. Jain, M.N. Murty, P.J. Flynn ~5.5 Fuzzy Clustering~ 院生ゼミ ‘04年5月18日(火曜日) 谷津 哲平 Fuzzy Clustering Fuzzy Clustering の概念 伝統的なクラスタリング手法では,パーティションを発生させる. ⇒各パターン(個体)は唯一の1個のクラスタに属する ファジィクラスタリングでは,帰属度関数(membership function)を 使って, 各パターンを全てのクラスタに関連付ける Zadeh [1965] Hard vs. Fuzzy Y 7 3 4 1 2 8 9 6 5 H1 H1 = { 1, 2, 3, 4, 5} H2 = { 6, 7, 8, 9} H2 Hard Clustering X Hard vs. Fuzzy Y F1 7 3 F2 4 1 2 9 6 5 H1 8 H2 Fuzzy Clustering X F1 = { (1,0.9), (2,0.8), (3,0.7), (4,0.6), (5,0.55), (6,0.2) , (7,0.2), (8,0.0), (9,0.0)} F2 = { (1,0.0), (2,0.0), (3,0.0), (4,0.1), (5,0.15), (6,0.4) , (7,0.35), (8,1.0), (9,0.9)} Membership value Y F1 帰属度(メンバシップ値) 7 3 F2 4 1 2 8 9 6 5 ・各クラスタへの帰属性の度合い H2 ・各個体において,全てのクラスタ に対する帰属度の合計は「1」 H1 X ↓ ( i, μi) : ( i 番目の個体, その帰属度 ) F1 = { (1,0.9), (2,0.8), (3,0.7), (4,0.6), (5,0.55), (6,0.2) , (7,0.2), (8,0.0), (9,0.0)} F2 = { (1,0.0), (2,0.0), (3,0.0), (4,0.1), (5,0.15), (6,0.4) , (7,0.35), (8,1.0), (9,0.9)} Membership value Y F1 0.2 0.3 0.6 3 0.9 1 0.8 0.0 0.0 8 0.1 0.2 0.55 5 F2 0.0 4 0.0 2 70.35 6 0.4 1.0 0.0 9 0.9 0.15 Fuzzy Clustering 帰属度の最も大きい値のクラスタに属させることでハードに変換できる X 例) ある個体 xi がクラスタ ck に属するなら uik=1,属さないなら uik=0 Fuzzy Clustering Algorithm 評価関数 N:個体数 K:クラスタ数 U : 帰属度行列.N × K の行列 uij :U の要素.個体 xi のクラスタ cj に対する帰属度を表す xi : i 番目の個体 ck : k 番目のファジィクラスタ中心 Fuzzy Clustering Algorithm Step1 帰属度行列 U によって,ファジィパーティションの 初期値を選ぶ Step2 U を使って評価関数の値を求める Step3 U の著しい変化がなくなるまで,Step2を繰り返す E2の値を小さくしていく N:個体数 K:クラスタ数 U:帰属度行列 x:個体 c:クラスタ中心 Fuzzy c-means (FCM) 1961 Ruspini : fuzzy set theory を初めて適用 1981 Bezdek : FCMアルゴリズムの一般化 1992 Dave : fuzzy c-shell と 楕円境界の検出の提示 <FCM> ・最もポピュラーなファジィクラスタリング手法 ・hard k-means よりも局所的な最小値を避けることが優れている ・二乗エラー基準の局所的な最小値に集めることができる
© Copyright 2024 ExpyDoc