「Kaggleで勝つ データ分析の技術」を読んだメモ

機械学習

Kaggleで遊ぶために、図書館にあったので読んだ時のメモ。

  • 機械学習の話をあまり分からない状態では2章3章の話が分かりづらいが、気にせず読み進むのが吉
  • とりあえずテーブル形式のコンペを基本として、勾配ブーストを用いた決定木(GBDT)を使ってやって見る
  • 手法は流行り廃りがあるので、コンペのコードを見るのが良い

各種モデルのパラメータのベースライン(参考値)

各種モデルに設定するパラメータについて、ベースラインの記述があり、参考になりそうだったので残しておく。

・XGBoostのパラメータのベースライン

XGBoost Parameters | XGBoost Parameter Tuning
This article explains XGBoost parameters and xgboost parameter tuning in python with example and takes a practice problem to explain the xgboost algorithm.

・ニューラルネットワークのパラメータのベースライン

kaggle-HomeDepot/model_param_space.py at 55c1033d0af3b6cf2f033fe4bcf3e1e0ffda3445 · ChenglongChen/kaggle-HomeDepot
3rd Place Solution for HomeDepot Product Search Results Relevance Competition on Kaggle. - kaggle-HomeDepot/model_param_space.py at 55c1033d0af3b6cf2f033fe4bcf3...

参考リンク

個人的に興味深いと思ったリンク。

I trained a model. What is next?
This post was written by Vladimir Iglovikov, and is filled with advice that he wishes someone had shared when he was active on Kaggle.

コメント