Kaggler-jaで紹介されていたのでメモ。
要点
- Eコマースの商品推薦に関するコンテスト
- ユーザのセッション履歴が与えられる
- テストデータはセッションの後半部分か切り取られた状態
- 切り取られた部分を予測する
- クリック:次にクリックしそうな商品を予測(20個まで)
- カート追加・購入:切り取られた部分でカート追加・購入が発生している商品を予測(20個まで)
- 正解ラベルを作るスクリプト
- https://github.com/otto-de/recsys-dataset/blob/main/src/labels.py
- モデル評価は重み付けリコール(クリック0.1、カート追加0.3、購入0.6)
所感
ベースラインとして人気な商品がクリック・カート追加・購入になっていると思うので、練習で↓を写経しようと思う。
OTTO-MORS: aid Frequency Baseline
Explore and run machine learning code with Kaggle Notebooks | Using data from OTTO – Multi-Objective Recommender System
久しぶりにKaggle notebookを触るとRAMがMax 30GBになっていて驚いた。これならデータ全部読めるかと思ったがダメだった。そこで↓(データを全て読み込むcode)。助かる。
💡 [Howto] Full dataset as parquet/csv files
Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources
コメント