確率分布 Probability Distribution


|| 要は確率を返す関数全体のこと

「データ X 」から「確率 P(X) 」が求められて、

この時の『 P 』のことを確率分布と言います。

スポンサーリンク




厳密な定義は「可測空間」上で定義された「確率測度」のこと。

これの詳細は長くなるんで別の記事で改めてやります。




形式的な定義よりも、まずは具体例を見てみましょう。

例として便利なんで、いつものようにサイコロを使います。



出目を「 X 」としましょうか。(離散型)

そして、この目の出る確率を『 P(X) 』とします。


X 1 2 3 4 5 6
P(X) \displaystyle \frac{1}{6} \displaystyle \frac{1}{6} \displaystyle \frac{1}{6} \displaystyle \frac{1}{6} \displaystyle \frac{1}{6} \displaystyle \frac{1}{6}



この時の「 P(X) 」が『確率分布』です。






他に「確率変数(データ)」を「連続型」で考えるなら、

例えば「半数が前の成績より良い」みたいな感じだと↓




X X≤1 1≤X
P(X) \displaystyle \frac{1}{2} \displaystyle \frac{1}{2}



これを表すと、


\displaystyle P(X≤a)=\frac{1}{2}




つまり『確率分布』っていうのは、大雑把には、

「確率が求められる関数」のことなわけですね。






関連する項目に『累積分布関数』と『確率密度関数』があります。

どちらもこれとセットで覚えておきましょう。