確率密度関数 Probability Density


|| 連続データの時に定義される関数

これは「連続型のデータが表す分布の形を表す関数」になります。

より厳密には「累積分布関数の導関数」です。

スポンサーリンク




単純な話、データが範囲内でなんでもとれる(連続)と、

分布を点々じゃなく、線で表す必要があります。

しかし、これは「累積分布関数」では表せません。



そこで、この関数が必要になります。

『範囲を指定すれば、面積として確率が求められる関数』として、

グラフに書ける関数が求められるわけです。




具体的には↓になります。


\displaystyle Pr(a<X≤b)=F_X(b)-F_X(a)=\int_{a}^{b}f_X(x)dx



これの「 f_X(x) 」が『確率密度関数』です。

見ての通り、データが連続型じゃないと出てきません。




↑の式は「確率」を表しているので、

全区間 I=(a,b] を考えると、

『確率密度関数』は、定義から↓になります。


\displaystyle Pr(a<X≤b)=\int_{a}^{b}f_X(x)dx=1