kmeans法

概要

データを元に非階層型クラスタリングを行う手法の一つ。クラスタの重心とクラスタへの割り当てを交互に繰り返す。
Facebookシェア Twitterツイート LINEで送る このエントリーをはてなブックマークに追加
この章を学ぶ前に必要な知識
0
条件
  • 何個のクラスタに分けるかをあらかじめ決めておく
効果
  • データをk個のクラスタに分けることができる
  • 各クラスタの中心とクラスタの要素間の距離の合計値を最小化する
ポイント
  • 初期値によって結果が変わる
  • 初期値に依存した極小値を得る
  • 何度か行って最も良い結果を使用するなどの工夫がある

解 説

k-means法(k平均法)はk個のクラスタに非階層型クラスタリング手法の一つ。 手順は 1.(初回のみ)n個のデータに適当にk個のクラスタを割りあてる 2. 各クラスタの中心を計算する 3. クラスタ中心に最も近いデータにクラスタを割り当て直す。 4. 2.3をやっても変わらないや変化が少ない→終了
kmeansとは
問題点は、 初期値に強く依存する ことがあげられる。 そのため思ったようなクラスタリングにならないことが多かった。 これに対する改善が他の手法において主に試みられている。
kmeansの問題点

1.デモンストレーション

右のリンクからK-means法のデモンストレーションを確認してみましょう.
この章を学んで新たに学べる
Comments

Reasons
>>隠す