|| 確率分布を表す関数の名前
要は「確率を返すための関数」のことです。
名前の通りに「分布」を表します。
スポンサーリンク
要は「確率変数(データ) X 」を入れると、
それに対応する確率を返す「関数 F_X(x)=P(X≤x) 」のことです。
『確率分布』よりも、ちょっとだけ狭い意味になります。
確率変数が離散型
離散型(点々)の方が直観的なので、先にそっちを見ましょう。
表す意味は「 L 以下のデータのどれかが出る確率」になります。
\displaystyle F_X(L)=Pr(X≤L)=\sum_{x≤L}Pr(X=x)=\sum_{x≤L}p(x)
感じとしては、そのまま「確率を足し合わせたもの」になります。
どの確率かというと、具体的には「データ x の確率」です。
データ X がとり得る範囲を 1≤X にするなら、
L=3 なら、Pr(1)+Pr(2)+Pr(3) という感じ。
1 か 2 か 3 のどれかが出る確率を表してます。
こんな感じに、確率を関数みたいに扱えるわけですね。
確率変数が連続型
んで、連続型(線に見える点の集まり)は↓になります。
基本的には離散型のデータが連続型のデータになっただけです。
\displaystyle Pr(a<X≤b)=Pr(X≤b)-Pr(X≤a)
\displaystyle =\int_{-\infty}^{b}f_X(x)\,dx-\int_{-\infty}^{a}f_X(x)\,dx =\int_a^bf_X(x)\,dx
\displaystyle =F_X(b)-F_X(a)
この「 F_X(x) 」が「累積分布関数」と呼ばれるものになります。
そしてこれから『確率密度関数』は定義されます。
これの厳密な決まりなんかは、ちょっとごちゃっとしてます。
「特性関数」ととか『確率測度』なんかの知識が必要です。