- @ThothChildren
- 2018.5.24
- PV 1505
確率分布間の差異で類似度を求めたい
ー 概要 ー
二つの確率分布がどれほど異なっているかの指標を持って確率分布間の類似度を計算する方法についてまとめます.機械学習などにおいて頻繁に使用されるKLダイバージェンスやJSダイバージェンスについて紹介します.
この章を学ぶ前に必要な知識
条件
- 二つの確率分布が入力
効果
- 二つの確率分布の類似度(差異)が求まります
- 値が0なら一致、大きくなるほど似ていないことになります.
ポイント
- KLダイバージェンスとJSダイバージェンスについて紹介
解 説
確率分布の類似度は多くの機械学習や統計処理において必要になる数値になります.中でも確率分布の差異を表現しているKLダイバージェンスは頻繁に登場する数値です.
距離と表現できずダイバージェンスと呼んでいるのはある確率分布A,BからKLダイバージェンスを求めたのとB,Aから求めたのでは異なり、距離の定義から外れてしまうからです.(距離ならば、逆にしても同じ値になる必要あり) | 確率分布間の差異で類似度を求めたい導入 |
1.JSダイバージェンス | |
先にJSダイバージェンスについて紹介しますが、JSダイバージェンスの定義はとてもシンプルです。
KLダイバージェンスが前述のように対称性がない点が実用上やっかいなときがあるため、(A,Bで算出したもの)と(B,Aで算出したもの)を足して2で割ったものを算出することで、JS(A,B) == JS(B,A)となるように工夫しています. | JSダイバージェンスについて |
JSダイバージェンスの定義(Wikipediaより)
1/2しているのは各KLダイバージェンスに対して. | |
2.KLダイバージェンス | |
KLダイバージェンスは二つの確率分布の類似度を計算することができる値.
どれだけ差があるかが最終的な出力になります.
P=Qになると分布は完全に一致し値は0になります. | KLダイバージェンスとは |
離散的な確率分布がP,Qのときは左のような式でKLダイバージェンスを定義します. | |
KLダイバージェンスは負になることはありません.
| KLダイバージェンスの特徴 |
こちらはpとqが連続値の関数担った場合のKLダイバージェンス | |
KLダイバージェンスが差異を求めている図解 |
この章を学んで新たに学べる
Comments