俺人〜OREGIN〜俺、バカだから人工知能に代わりに頑張ってもらうまでのお話

俺って、おバカさんなので、とっても優秀な人工知能を作って代わりに頑張ってもらうことにしました。世界の端っこでおバカな俺が夢の達成に向けてチマチマ頑張る、そんな小さなお話です。現在はG検定、E資格に合格し、KaggleやProbSpaceのコンペに参画しながら、Pythonや機械学習、統計学、Dockerなどの勉強中です。学習したことをブログにアウトプットすることで、自分の身に着けていきたいと思います。まだまだ道半ばですが、お時間がありましたら見て行ってください。

E資格対策振り返り(応用数学-確率)

E資格(JDLA Deep Learning for ENGINEER 2019 #2)対策として、今回は、応用数学の分野のうち、確率を振り返ります。直接確率を求める問題が出るかはわかりませんが、過去問や例題等を解くうえでは、確率の考え方が理解できたほうがすっと入ってきます。

では、一般的な確率の考え方から、確率変数、確率分布、期待値の順に振り返っていきたいと思います。

  

確率

1.確率とは

まずは、確率を定義します。

「試行」に対して、「事象A」が起こる確率P(A)は、以下の通り定義されます。

f:id:kanriyou_h004:20190923120814p:plain

【Case_A】:事象Aが起こるすべてのケースの数

【All_Cases】:起こりうるすべての事象のケースの数

【試行】:同一の環境で繰り返し実施可能で、その結果が確率的に特定される観測(例:サイコロ振り、コイントス

【事象】:「試行」の結果起こる事柄(例:サイコロで3が出る。コイントスで表がでる。) 

サイコロの面が6面ありますので、サイコロを1回投げるときに3が出る確率は、6分の1となり、コイントスで表が出る確率は2分の1となるのは、直感的にもわかりやすいので、確率の定義は、わかりやすいです。

2.確率変数とは

では、次に「確率変数」についてです。

「変数」とついただけで、急に難しく感じてしまいますが、プログラミングの経験がある方にとっては、「ある確率で値が決まる変数」と解釈すれば、しっくりくると思います。

例えば、サイコロを1回振る際の出た目を、変数「X」とすると、この「X」は確率変数となります。

<参考>

サイコロの場合、どの目が出る確率も6分の1なので、確率変数Xが各値をとる確率は、以下の通りとなります。

X=1となる確率は、6分の1

f:id:kanriyou_h004:20190923122446p:plain

X=2となる確率は、6分の1

f:id:kanriyou_h004:20190923122636p:plain

・・・

X=6となる確率は、6分の1

f:id:kanriyou_h004:20190923122750p:plain 

 なお、確率変数には、以下の2つの変数が存在します。

・離散変数:確率変数の値が、サイコロやコイントスのように、非連続な変数

・連続変数:確率変数の値が、ある1日の最高気温や、消費電力量のように連続的な変数

E資格の対策としては、まずは離散変数での理解を深める必要があります。離散変数が一通り理解できれば、連続変数の理解もしやすいと思います。

3.確率分布とは

確率変数が、「ある確率で値が決まる変数」であったことに対して、確率分布は、「確率変数がある値をとる場合の確率」の分布と考えることができまます。

少しややこしいですが、実例を見ると簡単です。

例)サイコロを2個投げて、出た目の合計を確率変数Xと定義。

Xのとりうる値をxとおくと

f:id:kanriyou_h004:20190923124222p:plain

このとき、X=2となる場合は、出た目が両方とも1である場合の1通りのみのため、P(X=2)は、以下のとおり。

f:id:kanriyou_h004:20190923124657p:plain

同様に、X=3となる場合は、出た目が(1,2)の場合か、(2,1)の場合の2通りしかないため、P(X=3)は、以下の通り。

f:id:kanriyou_h004:20190923124908p:plain

すべてのxに対して確率を求めると、以下の図のようになる。

f:id:kanriyou_h004:20190923125903p:plain

上記のように、Xが各値xをとる確率P(X=x)の分布を、「確率分布」と呼びます。

4.期待値とは

「期待値」とは、ある確率で起こる事象について、発生すると思われる、おおよその値のことをいい、期待値E(X)は、以下の計算式で求めます。

f:id:kanriyou_h004:20190923131536p:plain

つまり、期待値は、とる値xと、その値となる確率P(X=x)の積をすべて足し合わせた数値ということになります。

すべての事象が同確率で発生する場合は、「平均値」と同等になるので、正しくはないかもしれませんが、感覚的に「確率を考慮した平均値」と理解しています。)

言葉で表現すると難しいですが、こちらも、実例で考えるとわかりやすいと思います。

例)確率分布の事例で出した2個のサイコロの目の和の場合以下の通りとなります。

f:id:kanriyou_h004:20190923132014p:plain

f:id:kanriyou_h004:20190923132051p:plain

f:id:kanriyou_h004:20190923132428p:plain

サイコロを2個振ると、出た目の合計は、おおよそ「7」となり、これが期待値ということになります。

期待値は、E資格の学習を進めるうえで、今後出てくる、情報理論等を理解する上で重要になってきますので、この概念を理解しておくことをお勧めします。 

 

今回は、確率の基礎の部分について、振り返ってみました。

また、確率の部分については、以下の書類も参考にして勉強しました。

(私は手持ちの版で学習しましたが、最新は第2版がでています。)

今後も、引き続き、復習をかねて、E資格対策を振り返っていきたいと思います。

  

2019年3月31日(土)にE資格を受験して、合格しました!

E資格対策として勉強の進め方や、参考書などをまとめました。

これから受験される方がいらっしゃいましたらご参考まで。

oregin-ai.hatenablog.com 

 

 2019年3月9日(土)にG検定を受験し、見事合格できました!

受験の体験記や勉強法などを別のブログにまとめました。

これから受験される方がいらっしゃいましたらご参考まで。

g-kentei.hatenablog.com

 【E資格対策に使った参考書】