- @ThothChildren
- 2019.2.1
- PV 317
交差検証法
ー 概要 ー
データが少ない時には学習器の推定精度を適切に評価しにくいため、工夫が必要となります.交差検証法(Cross Validation法)は、一部を訓練データとして他をテストデータとした評価を何度か行い、どのデータもテストデータとも訓練データとも使用して評価をすることで予測誤差、推定精度をより正確にする手法です.
この章を学ぶ前に必要な知識
条件
- データ数が少ない時に有用
効果
- 少ないデータを使って予測精度をより正確に評価可能
ポイント
- データをK個に分けてそれぞれテストデータとして使い、それ以外を訓練データとする
- K回の推定誤差を平均して算出
解 説
データが少ない時には学習器の推定精度を適切に評価しにくいため、工夫が必要となります.交差検証法(Cross Validation法)は、一部を訓練データとして他をテストデータとした評価を何度か行い、どのデータもテストデータとも訓練データとも使用して評価をすることで予測誤差、推定精度をより正確にする手法です.
ここではN個のデータをK個に分割してそのうちの一つを訓練データ、それ以外をテストデータとしてK回評価するK分割交差検証について紹介します.
K=Nとした場合を一個抜き交差検証と呼び、一つだけをテストデータ、それ以外全てを学習データとして使用し、それをN回行います.
手順
1. N個のデータからN/K個のテストデータを取り出します.
2. 1.で取り出したテストデータ以外を訓練データとして取り出して学習器を訓練します.
3. 2.で訓練した学習器と1.のテストデータを使って予測精度を評価します.その推定誤差をeとする.
4. 上記の1~3を使っていないデータを全てで同様に行います. 全てのK回を終えた後に各々のeの平均をとります. | 交差検証法(Cross-Validation法) |
Cross-Validationの概要図.
この図では
N=8
K=4
となっており、
4回の評価を行い、その予測誤差を平均して評価をする |
この章を学んで新たに学べる
Comments