俺人〜OREGIN〜俺、バカだから人工知能に代わりに頑張ってもらうまでのお話

俺って、おバカさんなので、とっても優秀な人工知能を作って代わりに頑張ってもらうことにしました。世界の端っこでおバカな俺が夢の達成に向けてチマチマ頑張る、そんな小さなお話です。現在はG検定、E資格に合格し、KaggleやProbSpaceのコンペに参画しながら、Pythonや機械学習、統計学、Dockerなどの勉強中です。学習したことをブログにアウトプットすることで、自分の身に着けていきたいと思います。まだまだ道半ばですが、お時間がありましたら見て行ってください。

2019-06-01から1ヶ月間の記事一覧

ep4-3:多項式の次数を上げて近似する。( 「実践 機械学習システム」に学ぶ。)

オライリージャパン社の「実践 機械学習システム」に取り組んでいます。 今回は、多項式の次数を上げて近似します。 前回の直線で近似した記事は以下の通りです。 oregin-ai.hatenablog.com 実践機械学習システム [ ウィリ・リチャート ] では、順に取り組ん…

ep4-2:単純な直線で近似する。( 「実践 機械学習システム」に学ぶ。)

オライリージャパン社の「実践 機械学習システム」に取り組んでいます。 今回は、「単純な直線で近似する」を学びます。 実践機械学習システム [ ウィリ・リチャート ] では、順に取り組んでいきます。 1.まずは、誤差を計算する関数を定義する。 #誤差を定…

ep4-1: オライリー・ジャパン社「実践 機械学習システム」に学ぶ。

「Kaggle」のデータセット「Kickstarter Projects」の取り組みで、かなり苦戦したので、今一度、基礎から学ぶために、オライリージャパン社の「実践 機械学習システム」に取り組んでまいります。 今回は、データの読み込みと欠損値の処理を学びます。 実践機…

エピソード3-14: AdaBoostのまとめ(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んでいます。 前回挑戦した、木モデルのAdaBoostのコードをまとめました。 前回の記事は、以下にありますので、ご参照ください。 oregin-ai.hatenablog.com では、さっそくまとめです。 1.まずは、…

エピソード3-13: AdaBoostに挑戦してみる。Acc66%→67.5%(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んでいます。 今回は、一度NNモデルから離れて、木モデルのAdaBoostに挑戦します。 NNモデルの記事は、以下にありますので、ご参照ください。 oregin-ai.hatenablog.com では、さっそく取り組んで…

エピソード3-12: 選択した特徴量を使ってNNモデルの学習率をグリッドサーチする。Acc62%→66%(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、前回、LassoCVを使った特徴量選択を実施したので、その特徴量を使ってNNモデルを作り学習率をグリッドサーチします。 前回の記事は、以下にありますので、ご参照ください。 oregin-ai.hatena…

エピソード3-11: 正則化L1ノルム(Lasso)を使って特長量選択。(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、Leakageにハマってしまいましたが、気を取り直して、再度取り組み開始です。 ハマってしまった「Leakage」については、以下にまとめてあるのでご参照ください。 oregin-ai.hatenablog.com さ…

エピソード3-10: 大幅手戻り、Leakageにはまる。(KaggleでKickstarter Projectsに挑戦する。)

「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、順調に精度を向上させているかに見えたのですが、ここにきて、知人に「それ、Leakageじゃない?」と指摘され、今回は、Leakageの回避に取り組みました。 これまでの流れは以下にまとめてある…