- @ThothChildren
- 2018.5.27
- PV 235
集合内同一要素の数で類似度を測りたい
ー 概要 ー
集合内に含まれる同一の要素の数が他の要素と比べてどれくらい占めているかで集合の類似度を測る方法についてまとめます.
この章を学ぶ前に必要な知識
条件
- 複数の要素を含む二つの集合がある
効果
- 二つの集合の類似度が求まる
ポイント
- 同一の要素の数を何らかの数を母数として類似度を求める
解 説
二つの集合の類似度を求める方法について紹介します.
どの方法もある数を基準として共通部分の要素数がどれ程かで類似度を測ります.
紹介する類似度はどれも一切共通要素がない場合は、類似度0になり、要素が全て一致したときは1になります.
<各種類似度>
・Jaccard類似度
片方が片方を内包するときに1になる.Jaccard特徴量からDice類似度は一意に求められる.
・Dice類似度
片方が片方を内包するときに1になる.Dice特徴量からJaccard類似度は一意に求められる.
・Simpson類似度
片方が片方を内包するときに1にならない | 集合内同一要素の数で類似度を測りたい |
集合の類似度の他のアプリケーションとしては、
矩形領域の一致度においても
集合の要素の数ではなく面積の大きさでも同様に類似度を測る際に使用されます. | 矩形領域同士の一致度が欲しい |
$$Jaccard = \frac{ X ∩ Y }{ X ∪ Y }$$ | Jaccard特徴量 |
$$Dice = \frac{2 \times X ∩ Y }{ X + Y }$$ | Dice類似度 |
$$Simpson = \frac{ X ∩ Y }{ min(X, Y) }$$ | Simpson類似度 |
この章を学んで新たに学べる
Comments