- @ThothChildren
- 2017.9.13
- PV 94
Random Forest
ー 概要 ー
Random Forestは複数の決定木を集めて答えを出す機械学習手法の一つ.一つ一つの決定機の性能は高くなくとも全体で正しい答えを出す方式.
この章を学ぶ前に必要な知識
効果
- 分類、回帰ができる
ポイント
- 容易に並列化可能
- 学習が比較的高速
- 入力のうち大事なパラメータがわかる
- 決定木の深さを決める必要あり
- 複数の決定木を使うことで精度を高めている
解 説
RandomForestは2001年に発表された複数の決定木を学習して多数決で結果を出力する機械学習手法.
とらあえず簡単に試せるので、データがあったらすぐに試すことができる。
RandomForestの設定に当たって主なパラメータは以下のふたつ.
・いくつの決定木を用意するか
・一つの決定木でどれほど深くするか
後者のパラメータを多くしすぎると学習データに過学習してしまうので、ほどよい値にする。
学習をさせるとどの値が回帰、分類に役に立っているかが寄与度としてわかる。 | Random Forest概要 |
RandomForestの概要図 | |
Random Forestは上記のような一つの決定木において、分岐の条件を更新することで学習を進める.(ここでは条件A~D)。
学習の際にはデータを訓練データの中からランダムにサンプルしてそれぞれの決定木で学習する(ブートストラップサンプル)。 | RandomForestの学習 |
この章を学んで新たに学べる
Comments