Helve’s Python memo

Pythonを使った機械学習やデータ分析の備忘録

Scikit-learn

BaggingClassifierの使用例

前回の記事でscikit-learnのBaggingClassifierクラスについて解説したため、本記事では実際の使用例を示す。 基本的な使い方と、分類確率を出力する方法、warm startによる追加学習について示す。前回の記事: scikit-learnのBaggingClassifierでバギングす…

scikit-learnのBaggingClassifierでバギングする

scikit-learnには、アンサンブル学習を行うためのBaggingClassifierが実装されている。 本記事では、BaggingClassifierを用いた学習(バギング、ペースティング、ランダムサブスペース、ランダムパッチ)について解説する。目次 環境 アンサンブル学習 Baggi…

Scikit-learnの主成分分析 (PCA)

Pythonの機械学習ライブラリScikit-learnに実装されている主成分分析のクラスを調べた。本記事では、PCAクラスのパラメータ、属性とメソッドについて解説する。

Scikit-learnの正則化付き重回帰モデル

Pythonの機械学習ライブラリScikit-learnに実装されている重回帰モデルを調べた。通常の線形回帰に、回帰係数を正則化するRidge回帰、Lasso回帰、Elastic Netを加えた4種類の回帰モデルの基本的なロジックと使用方法をまとめた。

Scikit-learnでデータのスケール変換(前処理)する

Pythonの機械学習用ライブラリScikit-learnに実装されている、スケール変換について調べた。スケール変換を行うクラス3つのパラメータとメソッドをまとめ、各変換の結果を比較した。

<Scikit-learn> ランダムフォレスト回帰のfeature_importances_の定義

Scikit-learnの回帰木やランダムフォレスト回帰のクラスには、 Feature Importances (FI) という説明変数の重要度を示す指標があるが、 導出について公式のリファレンスに書かれていなかったため調べた。 結論から述べると、各説明変数による予測誤差の二乗…

※Adblockが有効の場合やモバイル版ページでは、シェアボタンをクリックできません