俺人〜OREGIN〜俺、バカだから人工知能に代わりに頑張ってもらうまでのお話

俺って、おバカさんなので、とっても優秀な人工知能を作って代わりに頑張ってもらうことにしました。世界の端っこでおバカな俺が夢の達成に向けてチマチマ頑張る、そんな小さなお話です。現在はG検定、E資格に合格し、KaggleやProbSpaceのコンペに参画しながら、Pythonや機械学習、統計学、Dockerなどの勉強中です。学習したことをブログにアウトプットすることで、自分の身に着けていきたいと思います。まだまだ道半ばですが、お時間がありましたら見て行ってください。

Kaggle

Kaggleの取り組みスケジュールを「ypad」でアナログ管理する。

今回は、私が毎年愛用している「ypad」についてご紹介したいと思います。 特に今年は、KaggleやSIGNATEなどのデータ分析コンペでのスケジュール管理にとても役に立ったので具体例を交えながら記載したいと思います。 KaggleやSIGNATEなどのデータ分析コンペ…

Kaggle鳥コンペの上位者に学ぶ(鳥コンペ反省会資料を読む)

今回は、KaggleのPublicスコアで初めてコンペ終了まで銅メダル圏内に残ることができました。しかしながら、Privateスコアでは一気に下がり、268位と大きくShakeDownすることになりました。 その原因の一つとして、現在の私のアプローチは、自身の知りうるデ…

2020年8月~9月の振り返り(ProbSpace不動産コンペからSIGNATE3連戦、そしてkaggle鳥コンペへ)

今年の8月~9月は、とても濃い2カ月だったので、自身の記録としてまとめていきたいと思います。 ProbSpaceで初のチームマージあり、8月末締め切りのSIGNATE関連の3つのコンペあり、そしてkaggleの鳥コンペでの苦い経験ありのジェットコースターのような…

機械学習初心者がデータ分析コンペサイトProbSpaceで総合ランク1位に到達するまでの道のり

機械学習について全くの専門外で初心者だった私がコンペサイトProbspaceのRe:不動産取引価格予測コンペで3位入賞、YouTube動画視聴回数予測コンペで9位入賞するなど、累計で金2銀1銅1を獲得することができ、総合ランクで1位に到達することができました…

機械学習初心者がコンペサイトProbSpaceで金銀銅を獲得し総合4位に到達するまでの道のり

機械学習について全くの専門外で初心者だった私が先日コンペサイトProbspaceのYouTube動画視聴回数予測コンペで9位入賞し、累計で金銀銅を獲得することができ、総合で4位に到達することができました。 これまでたどってきた道のりを振り返って、良かった点…

エピソード3-14: AdaBoostのまとめ(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んでいます。 前回挑戦した、木モデルのAdaBoostのコードをまとめました。 前回の記事は、以下にありますので、ご参照ください。 oregin-ai.hatenablog.com では、さっそくまとめです。 1.まずは、…

エピソード3-13: AdaBoostに挑戦してみる。Acc66%→67.5%(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んでいます。 今回は、一度NNモデルから離れて、木モデルのAdaBoostに挑戦します。 NNモデルの記事は、以下にありますので、ご参照ください。 oregin-ai.hatenablog.com では、さっそく取り組んで…

エピソード3-12: 選択した特徴量を使ってNNモデルの学習率をグリッドサーチする。Acc62%→66%(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、前回、LassoCVを使った特徴量選択を実施したので、その特徴量を使ってNNモデルを作り学習率をグリッドサーチします。 前回の記事は、以下にありますので、ご参照ください。 oregin-ai.hatena…

エピソード3-11: 正則化L1ノルム(Lasso)を使って特長量選択。(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、Leakageにハマってしまいましたが、気を取り直して、再度取り組み開始です。 ハマってしまった「Leakage」については、以下にまとめてあるのでご参照ください。 oregin-ai.hatenablog.com さ…

エピソード3-10: 大幅手戻り、Leakageにはまる。(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、順調に精度を向上させているかに見えたのですが、ここにきて、知人に「それ、Leakageじゃない?」と指摘され、今回は、Leakageの回避に取り組みました。 これまでの流れは以下にまとめてある…

エピソード3-9: 異常値(外れ値)を除いてみて精度を向上するか確認する。(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」にて、更に精度を向上させるために異常値の除去についても検討します。 これまでの流れは以下にまとめてあるのでご参照ください。 oregin-ai.hatenablog.com 国別とカテゴリーは成功率なので異常値はないと…

エピソード3-8: 説明変数の追加で精度を向上する。(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」にて、更に精度を向上させるためにほかの説明変数についても検討します。 これまでの流れは以下にまとめてあるのでご参照ください。 oregin-ai.hatenablog.com 1.【仮説1】'country' によって成功、失敗が…

エピソード3-7: KaggleでKickstarter Projectsに挑戦する。(ロジスティック回帰実装まとめ。)

「Kaggle」のデータセット「Kickstarter Projects」にて、ロジスティック回帰で分類するところまできたので、とりあえず実装コードをまとめておこうと思います。 これまでの流れは以下の記事をご参照ください。 oregin-ai.hatenablog.com 1.ロジスティック回…

エピソード3-6: KaggleでKickstarter Projectsに挑戦する。(ロジスティック回帰で分類する。)

現在取り組み中の「Kaggle」のデータセット「Kickstarter Projects」にて、分類に採用する説明変数を選択したので、ロジスティック回帰で分類していきたいと思います。 0.これまでの続きなので、ライブラリのインポートや、データ読み込み、データの前処理が…

エピソード3-5: KaggleでKickstarter Projectsに挑戦する。(採用する説明変数の選択)

前回から取り組み始めた「Kaggle」の過去問「Kickstarter Projects」にて、分類に採用する説明変数を選択していきたいと思います。 0.前回の続きなので、ライブラリのインポートや、データ読み込み、データの前処理が実施されている前提です。前回をご覧にな…

エピソード3-4: KaggleでKickstarter Projectsに挑戦する。(データの前処理編)

前回、「Kaggle」のアカウントを作成したものの、何から手をつけていいかわからないので、まずは、知り合いの勧めで「Kickstarter Projects」に挑戦したいと思います。 0. まずは、「Kaggle」のホームページにアクセスする。 1.検索窓に「Kickstarter Projec…

エピソード3-3: KaggleでKernelsを使ってみる。

以前、「Kaggle」のアカウントを作成したものの、何から手をつけていいかわからず放置していたので、まずは、「Kernels」を使ってみたいと思います。 パソコンよりも高性能だと聞いているので、楽しみです。 0. まずは、「Kaggle」にログインして、「Kernels…

エピソード3-2: Kaggleのアカウントを作成する

早速、「Kaggle」のアカウントを作成していこうと思います。 順を追って、画面コピーを取りながら記録していきましたので、これから登録される方は、参考にしてみてください。 (ただし、2019年3月24日現在の画面なので、変わってしまっている場合はご容赦く…

エピソード3-1: Kaggleへの道

E検定の受験に向けて、もう一つ活動を開始しようと思います。 それは、「Kaggle」です。 シリアルのメーカーでも、表参道のナチュラルな雑貨屋さんでもありません。 世界最大規模の機械学習コンペティション、それが「Kaggle」なのです。 www.kaggle.com 今…