2019-06-01から1ヶ月間の記事一覧
オライリージャパン社の「実践 機械学習システム」に取り組んでいます。 今回は、多項式の次数を上げて近似します。 前回の直線で近似した記事は以下の通りです。 oregin-ai.hatenablog.com 実践機械学習システム [ ウィリ・リチャート ] では、順に取り組ん…
オライリージャパン社の「実践 機械学習システム」に取り組んでいます。 今回は、「単純な直線で近似する」を学びます。 実践機械学習システム [ ウィリ・リチャート ] では、順に取り組んでいきます。 1.まずは、誤差を計算する関数を定義する。 #誤差を定…
「Kaggle」のデータセット「Kickstarter Projects」の取り組みで、かなり苦戦したので、今一度、基礎から学ぶために、オライリージャパン社の「実践 機械学習システム」に取り組んでまいります。 今回は、データの読み込みと欠損値の処理を学びます。 実践機…
「Kaggle」のデータセット「Kickstarter Projects」に取り組んでいます。 前回挑戦した、木モデルのAdaBoostのコードをまとめました。 前回の記事は、以下にありますので、ご参照ください。 oregin-ai.hatenablog.com では、さっそくまとめです。 1.まずは、…
「Kaggle」のデータセット「Kickstarter Projects」に取り組んでいます。 今回は、一度NNモデルから離れて、木モデルのAdaBoostに挑戦します。 NNモデルの記事は、以下にありますので、ご参照ください。 oregin-ai.hatenablog.com では、さっそく取り組んで…
「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、前回、LassoCVを使った特徴量選択を実施したので、その特徴量を使ってNNモデルを作り学習率をグリッドサーチします。 前回の記事は、以下にありますので、ご参照ください。 oregin-ai.hatena…
「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、Leakageにハマってしまいましたが、気を取り直して、再度取り組み開始です。 ハマってしまった「Leakage」については、以下にまとめてあるのでご参照ください。 oregin-ai.hatenablog.com さ…
「Kaggle」のデータセット「Kickstarter Projects」に取り組んで、順調に精度を向上させているかに見えたのですが、ここにきて、知人に「それ、Leakageじゃない?」と指摘され、今回は、Leakageの回避に取り組みました。 これまでの流れは以下にまとめてある…