交差検証法

ー概要ー

データが少ない時には学習器の推定精度を適切に評価しにくいため、工夫が必要となります.交差検証法(Cross Validation法)は、一部を訓練データとして他をテストデータとした評価を何度か行い、どのデータもテストデータとも訓練データとも使用して評価をすることで予測誤差、推定精度をより正確にする手法です.

この章を学ぶ前に必要な知識

条件

データ数が少ない時に有用

効果

少ないデータを使って予測精度をより正確に評価可能

ポイント

データをK個に分けてそれぞれテストデータとして使い、それ以外を訓練データとする
K回の推定誤差を平均して算出

解説

データが少ない時には学習器の推定精度を適切に評価しにくいため、工夫が必要となります.交差検証法(Cross Validation法)は、一部を訓練データとして他をテストデータとした評価を何度か行い、どのデータもテストデータとも訓練データとも使用して評価をすることで予測誤差、推定精度をより正確にする手法です.

ここではN個のデータをK個に分割してそのうちの一つを訓練データ、それ以外をテストデータとしてK回評価するK分割交差検証について紹介します.
K=Nとした場合を一個抜き交差検証と呼び、一つだけをテストデータ、それ以外全てを学習データとして使用し、それをN回行います.

手順
1. N個のデータからN/K個のテストデータを取り出します.
2.  1.で取り出したテストデータ以外を訓練データとして取り出して学習器を訓練します.
3. 2.で訓練した学習器と1.のテストデータを使って予測精度を評価します.その推定誤差をeとする.
4. 上記の1~3を使っていないデータを全てで同様に行います. 全てのK回を終えた後に各々のeの平均をとります.

交差検証法(Cross-Validation法)

Cross-Validationの概要図. この図では N=8 K=4 となっており、 4回の評価を行い、その予測誤差を平均して評価をする

この章を学んで新たに学べる

Comments

交差検証法

ー 概要 ー

解 説

Reasons >>隠す

ー概要ー

解説

Reasons
>>隠す