累積分布関数 Distribution function


|| 確率分布を表す関数の名前

要は「確率を返すための関数」のことです。

名前の通りに「分布」を表します。

スポンサーリンク




要は「確率変数(データ) X 」を入れると、

それに対応する確率を返す「関数 F_X(x)=P(X≤x) 」のことです。

『確率分布』よりも、ちょっとだけ狭い意味になります。






確率変数が離散型


離散型(点々)の方が直観的なので、先にそっちを見ましょう。

表す意味は「 L 以下のデータのどれかが出る確率」になります。



\displaystyle F_X(L)=Pr(X≤L)=\sum_{x≤L}Pr(X=x)=\sum_{x≤L}p(x)



感じとしては、そのまま「確率を足し合わせたもの」になります。

どの確率かというと、具体的には「データ x の確率」です。




データ X がとり得る範囲を 1≤X にするなら、

L=3 なら、Pr(1)+Pr(2)+Pr(3) という感じ。

123 のどれかが出る確率を表してます。




こんな感じに、確率を関数みたいに扱えるわけですね。






確率変数が連続型


んで、連続型(線に見える点の集まり)は↓になります。

基本的には離散型のデータが連続型のデータになっただけです。



\displaystyle Pr(a<X≤b)=Pr(X≤b)-Pr(X≤a)

\displaystyle =\int_{-\infty}^{b}f_X(x)\,dx-\int_{-\infty}^{a}f_X(x)\,dx =\int_a^bf_X(x)\,dx

\displaystyle =F_X(b)-F_X(a)




この「 F_X(x) 」が「累積分布関数」と呼ばれるものになります。

そしてこれから『確率密度関数』は定義されます。




これの厳密な決まりなんかは、ちょっとごちゃっとしてます。

「特性関数」ととか『確率測度』なんかの知識が必要です。