交差検証法

概要

データが少ない時には学習器の推定精度を適切に評価しにくいため、工夫が必要となります.交差検証法(Cross Validation法)は、一部を訓練データとして他をテストデータとした評価を何度か行い、どのデータもテストデータとも訓練データとも使用して評価をすることで予測誤差、推定精度をより正確にする手法です.
Facebookシェア Twitterツイート LINEで送る このエントリーをはてなブックマークに追加
この章を学ぶ前に必要な知識
1
条件
  • データ数が少ない時に有用
効果
  • 少ないデータを使って予測精度をより正確に評価可能
ポイント
  • データをK個に分けてそれぞれテストデータとして使い、それ以外を訓練データとする
  • K回の推定誤差を平均して算出

解 説

データが少ない時には学習器の推定精度を適切に評価しにくいため、工夫が必要となります.交差検証法(Cross Validation法)は、一部を訓練データとして他をテストデータとした評価を何度か行い、どのデータもテストデータとも訓練データとも使用して評価をすることで予測誤差、推定精度をより正確にする手法です. ここではN個のデータをK個に分割してそのうちの一つを訓練データ、それ以外をテストデータとしてK回評価するK分割交差検証について紹介します. K=Nとした場合を一個抜き交差検証と呼び、一つだけをテストデータ、それ以外全てを学習データとして使用し、それをN回行います. 手順 1. N個のデータからN/K個のテストデータを取り出します. 2. 1.で取り出したテストデータ以外を訓練データとして取り出して学習器を訓練します. 3. 2.で訓練した学習器と1.のテストデータを使って予測精度を評価します.その推定誤差をeとする. 4. 上記の1~3を使っていないデータを全てで同様に行います. 全てのK回を終えた後に各々のeの平均をとります.
交差検証法(Cross-Validation法)
Cross-Validationの概要図. この図では N=8 K=4 となっており、 4回の評価を行い、その予測誤差を平均して評価をする
この章を学んで新たに学べる
Comments

Reasons
>>隠す