機械学習界隈で、最強アルゴリズムの一角を占めていたランダムフォレスト。ディープラーニングが登場した後急速に存在感をなくすものの、その利便性と強力さから多くのデータサイエンティストが現役利用中。
scikit-learnでのランダムフォレスト、分類モデルと重要度評価の実装方法まとめました。
しかし、決定木は過学習を起こしやすいという問題点がありました。
前の記事:Pythonの決定木分析できのこ派とたけのこ派を予測する続きを読む
scikit-learnでのランダムフォレスト、分類モデルと重要度評価の実装方法まとめました。
決定木の問題点
決定木は、上から順に条件分岐を作って分類モデルを作る手法です。ルールが可視化できる、正規化や標準化などのデータ加工が不要など、素晴らしいアルゴリズムです。しかし、決定木は過学習を起こしやすいという問題点がありました。
前の記事:Pythonの決定木分析できのこ派とたけのこ派を予測する続きを読む