Bagging(バギング)とは
意味
Azure Machine Learningなどで機械学習を実践する際に、一度はBagging(バギング)という文言を目にしたことがあるのではないでしょうか。
ランダムフォレスト等を使用していると、リサンプリング手法として選べたりしますね。
なんとなくで使っている時期もありましたが、ちょっと調べてみました。
Bagging(バギング)とはブートストラップ法の一種で、学習精度を高める手法です。
bootstrap aggregating からの略語だそうで…。
ド文系の私ができる限り噛み砕いて解釈すると、以下のようになります。
“ある標本集団からのリサンプリング(重複を認める)を複数回行い、独立した各かたまりの学習結果の平均等を取ることで、分散を小さくし、過学習を防ぐことができる手法”
リサンプリング(再標本化)… 母集団から抽出した標本集団より、再抽出を行うこと。
リサンプリング結果が独立している点が結構重要みたいです。後に挙げる特長にも関係します。
特長
他のブートストラップ法と比べ、Bagging(バギング)の優れている点としては、結果が出るまでの所要時間が短いことが挙げられます。
他の手法では、1回目のリサンプリング⇒学習の反省点を、2回目のリサンプリング⇒学習に生かして、次回へ…次回へ…というものもありますが、これでは精度こそ良くなりますが時間がかかります。
その点、Bagging(バギング)は重複許容のリサンプリングを複数回行い、それぞれの学習を並列で流すことができるため、高速に学習できます。
今回はここまで!
平成生まれのアラサー文系ぽんこつシステムエンジニア。
エンジニアらしく技術系の記事を書いたり、全く関係ない記事を書いたり、まったりやっていきたいです。
AI(人工知能)、デジタルマーケティング、DX、Office365活用、ガジェットなどに興味があります。
コメント