|| 連続データの時に定義される関数
これは「連続型のデータが表す分布の形を表す関数」になります。
より厳密には「累積分布関数の導関数」です。
スポンサーリンク
単純な話、データが範囲内でなんでもとれる(連続)と、
分布を点々じゃなく、線で表す必要があります。
しかし、これは「累積分布関数」では表せません。
そこで、この関数が必要になります。
『範囲を指定すれば、面積として確率が求められる関数』として、
グラフに書ける関数が求められるわけです。
具体的には↓になります。
\displaystyle Pr(a<X≤b)=F_X(b)-F_X(a)=\int_{a}^{b}f_X(x)dx
これの「 f_X(x) 」が『確率密度関数』です。
見ての通り、データが連続型じゃないと出てきません。
↑の式は「確率」を表しているので、
全区間 I=(a,b] を考えると、
『確率密度関数』は、定義から↓になります。
\displaystyle Pr(a<X≤b)=\int_{a}^{b}f_X(x)dx=1