【参加報告】atmaCup#10に参加してみた
はじめに
2021/03/05 〜 2021/03/13 の日程で開催されていたatmaCup#10に参加してみました。
Kaggleに登録してから早数年経っているくせに、コンペはほぼやったことないので間違いなく初心者。コンペタイトルが[初心者歓迎!]だったのでここぞとばかりに参加してきました。
お題は?
コンペページからそのまま以下。
美術作品の属性情報から、その作品がどのぐらい人々に評価されるのか?を予測します。
標準的なテーブルデータに加えて、作者名や作品説明などの自然言語情報や、絵画の色情報などが与えられていて、面白い題材でした。
ただ、残念なことにコンペ期間中に仕事がかなり忙しくなってしまい、実質参加できたのは10時間程度でした。(次のatmaCupまだかなぁ……)
どうだったのか?
LB : 170位
PB : 173位
やったこととしては、ディスカッションが活発&上級者が色々な知見をわかりやすく動くコードで紹介していてくれたので、それをほぼなぞっただけです。あとは絵画の面積足してみたり、適当な特徴量同士の数値をかけ合わせてみたり……。
良かったこと
初心者講座なるものがかなり分かりやすい
合計2回あって、1回目はどうsubmissionするか、2回目はどう工夫するか、というのがメインでした。データの見方とか、手間を省くコードの書き方とか、初心者が知りたいことが詰まってました。2回目のほうは内容が重くてまだ全部理解できていないので、LateSubmissionする自分に期待。
ディスカッションが日本語
Kaggleのディスカッションも頑張って眺めるのですが、英語がわからなさすぎて結構辛いので、日本語で読めるのは精神的にありがたかったです。エンジニアしているくせに英語ができないのが悪い。
サブミットしたときの表示がかわいい
めちゃくちゃやる気が湧く。
今後取り組みたいこと
実験管理
少ししかsubmitできていないですが、特徴量やパラメータやらモデルが分からなくなることが多々。先人の知恵がネットにたくさん転がっているので自分なりの管理方法を模索したいです。
手札を増やす
今回あまり時間をかけられなかったせいもあるのですが、"次になにをしよう"という知見がないのが地味に辛かったです。特に今回は短期間コンペだったので、いかに短時間に色々なことができるか、が大事だった気がします。ここは経験を増やすしかないと思っています。
自分なりのパイプラインを作る
コンペに参加したらとりあえず脳直にできることを増やしていきたい。これもコンペに参加することから始めたいと思います。
そもそも機械学習の知識を付ける
機械学習・統計学・数学をちまちまと勉強していますが、それが使えるようになるのはいつのことやら……。信じて勉強していくしかない気がする。
チームを組んでみたい
今は初心者MAXなので迷惑をかけるだけかもしれないけど、いつか人とチーム組んでコンペしてみたいです。やる気が途切れなくて済むかも。同じくらいの初心者の人だったら逆に組みやすかったりする……?
おわりに
参加した皆さん、お疲れさまでした。
また、ディスカッションを盛り上げてくれた方、知見やコードを共有してくれた方、運営の方、ありがとうございました。とても楽しかったです。