2020年は、昨年から取り組み始めた機械学習の積み上げの成果を試すため、いろいろなデータ分析サイトのコンペティションに挑戦しました。
日々の積み上げの結果が実を結び、複数のコンペティションで入賞することができました。
いろいろと環境が激変し、大変な1年でしたが、自身の成長においては、とても有意義で濃厚で、思い出深い1年となりました。
では、振り返っていきたいと思います。
【目次】
【コンペ関連】
1.ProbSpaceで総合ランキング1位に(金:3個、銀:2個)
今年、最も結果をのこせたのは、データ分析プラットフォームProbspaceで開催されたコンペでした、以下の通り、金:3個、銀:2個を獲得することができて、総合ランキングでも1位(2020年12月31日時点)になることができました。
各コンペでの記録は以下の通りです。(Youtubeコンペの振り返りを投稿していなかったことに今気づきました・・・。)
- 2020年1月 浮世絵作者予測コンペ 10位 銀
関連記事:ProbSpace浮世絵作者予測コンペ振り返り(10位にランクイン!) - 2020年6月 YouTube動画視聴回数予測 9位 金
- 2020年8月 Re:不動産取引価格予測 3位 金
関連記事:ProbSpaceのRe:不動産取引価格予測コンペの振り返り(3位入賞!) - 2020年10月 対戦ゲームデータ分析甲子園 9位 金
関連記事:【9位解法】ProbSpace開催「対戦ゲームデータ分析甲子園」の振り返り - 2020年12月 スパムメール判別 10位 銀
関連記事:【10位解法】ProbSpace開催「スパムメール判別」コンペの振り返り
2.SIGNATE、Solafuneで衛星画像コンペに挑戦
宇宙にとても憧れをもっている私は、衛星画像を利用したコンペはとても魅力てきでした。
具体的には、CDLEハッカソン2020の予測性能部門 「画像データに基づく気象予測」(SIGNATE開催)と、衛星データ分析サイトのSolafuneで開催された「衛星画像から空港利用者数を予測」の2つに挑戦し、以下の結果を残すことができました。
- 2020年8月 SIGNATE 画像データに基づく気象予測 2位 優秀賞
関連記事:【2位解法】SIGNATE開催CDLEハッカソン2020予測性能部門 「画像データに基づく気象予測」の振り返り - 2020年11月 Solafune 衛星画像から空港利用者数を予測 2位
関連記事:【2位解法】Solafune開催「衛星画像から空港利用者数を予測」の振り返り
3.Nishikaで初の賞金獲得
また、データサイエンスコンペティションサイトのNishikaで開催されたJリーグプレイヤーの出場時間予測に参加し、2位にランクインし、初の賞金を獲得しました。
PublicLBの6位から、PrivateLBでの2位にShakeUpしての入賞だったので、とても驚きました。
賞金圏に入ると、コードの検収等の手続きがあり、自身のコードを確認いただくために整理するという初めての取り組みが、とても良い経験になりました。
- 2020年11月 Nishika Jリーグプレイヤーの出場時間予測 2位
関連記事:【2位解法】Nishika開催「Jリーグプレイヤーの出場時間予測」の振り返り
【積み上げ関連】
1.GCI 2019 Winter(東京大学グローバルインテリジェンス寄付講座)受講
2019年12月から2020年3月まで、GCI 2019 Winter(東京大学グローバルインテリジェンス寄付講座)を受講しました。
こちらは、東大生だけでなく、社会人も受講可能なデータサイエンスの基礎から、機械学習スキルまで、習得できる講座です。この講座は、3カ月にわたる講座にもかかわらず、「無料」で受講できました。
全8回のカリキュラムで、1回ごとに期限付き宿題の提出や、kaggle形式のコンペティション、事業提案を実施する課題など、修了するためには、かなりハードな取り組みとなりましたが、確実に自身のスキルアップにつながりました。
今年、各種コンペで結果を残せたのもこの講座のおかげだと思っています。
2.E資格の復習
また、E資格で学習した、LSTMや、GRUなどのグラフ図を自分の手で何度も書いてみて、復習をしました。
一度理解したつもりになっていても、誰かに説明するつもりで整理すると、あいまいに理解していた部分が出てきて、確認することで、さらに理解を深めることができました。
3.Dockerの習得(米国AI開発者がゼロから教えるDocker講座受講)
機械学習そのものの学習ではないのですが、様々なコンペでとても役に立ったのが
Dockerの習得でした。習得にあたってはオンライン学習プラットフォーム「Udemy 」の「米国AI開発者がゼロから教えるDocker講座 」を受講いたしました。
コンペは、テーブルコンペ、画像処理コンペ、自然言語処理コンペなどなど、いろいろなコンペがあり、コンペ毎に開発環境を変えたりする必要がありました。
そんな時にDockerを使って簡単に開発環境を構築・複製・変更できたのは、非常に有意義でした。
4.AIQuest受講(現在も受講中)
さらなる積み上げとしての8月に募集が開始された経済産業省が実施しているAI Quest 2020|SIGNATEにも応募し、アセスメントに参加した結果、受講資格が得られました。
守秘義務があり、詳細は記載できませんが、要件定義あり、コンペ形式でのAI開発あり、経営層向けのプレゼンありで、実業務に即した、かなり濃厚な講座です。
なんとか、第一タームをクリアすることができたので、12月からの第二タームも取り組中です。
5.社会人のためのデータサイエンス演習 (2020年11月29日終了)
さらなる積み上げとしての取り組みとしてもう一つ、総務省統計局提供の「社会人のためのデータサイエンス演習」を受講しました。
こちらは、いわゆる機械学習というわけではないのですが、エクセルを使った統計的な集計方法や、データをどのように確認・評価していくかについて、実際に手を動かしながら学習できる講座でした。
約2ヶ月間、動画で学習→演習課題に取り組むを繰り返し、とても有意義な時間を過ごすことができました。しかも無料なので、とてもお財布に優しい講座でした。
おわりに
今年は、本当にいろいろなことを学び、いろいろなことに挑戦し、いろいろな皆さんと巡り合い、とてもとても有意義な一年でした。
これからも、積み上げ・挑戦を続けて、自身のスキルアップをするとともに、世の中に貢献できる人材になっていきたいと思います。
本年は、本当にいろいろな皆様にお世話になりました。誠にありがとうございました。
来年もよろしくお願いいたします!
【これまでの道のり】