確率変数 Random Variable


|| ある確率で起き得るものを表したやつ

簡単には「一定の確率でとれるデータ」のことです。

より正確には「データを数値に対応付けするもの」になります。

スポンサーリンク




数値にするんで「離散型」と「連続型」に分けられます。

どっちも直観的ですけど「離散型」の方から見ていきましょうか。




例えばよく出てくる「サイコロを 1 個降った時の目」とかなら、

『確率変数』とは、例えば「確率 1/6 」を持ってる、

1,2,3,4,5,6 」のどれか一つを表すものです。




んで、比較のために別のも見ると、

例えば「 2 個降る時」は↓です。



標本空間 S_{first}=\{1,2,3,4,5,6\},\,S_{second}=\{1,2,3,4,5,6\}

同じものなんで S^2=\{1,2,3,4,5,6\}^2 と表して、

これから『事象』を作ります。




正確な定義を紹介するために、あえてちょっと変な書き方をします。

↑の『標本空間から事象を作る』という操作を「関数 X 」として、



\displaystyle X(s,s)=\begin{cases} \displaystyle (1,1) & \mathrm{if} & \{1,1\} \\ \displaystyle (1,2),(2,1) & \mathrm{if} & \{1,2\},\{2,1\} \\ \displaystyle (1,3),(3,1) & \mathrm{if} & \{1,3\},\{3,1\} \\ …\\ \displaystyle (2,2) & \mathrm{if} & \{2,2\} \\ \displaystyle (2,3),(3,2) & \mathrm{if} & \{2,3\},\{3,2\} \\ …\\ \end{cases}

s∈S^2



こんなのが作れます。

厳密には「 (s,s) 」を一つの値にしてください。



そして、これと『確率』の対応は↓です。



\displaystyle f_X(s)=\begin{cases} \displaystyle \frac{1}{36} & \mathrm{if} & (s,s)=(1,1) \\ \displaystyle \frac{2}{36} & \mathrm{if} & (s,s)=(1,2)=(2,1) \\ \displaystyle \frac{2}{36} & \mathrm{if} & (s,s)=(1,3)=(3,1) \\ …\\ \displaystyle \frac{1}{36} & \mathrm{if} & (s,s)=(2,2) \\ \displaystyle \frac{2}{36} & \mathrm{if} & (s,s)=(2,3)=(3,2) \\ …\\ \end{cases}



ややこしく書いちゃいますが、やってることは単純です。

これは見たまま「標本空間から得られた事象」が作られて、

その「事象に、確率を割り当てている」わけですね。




結論から行くと、この「 X 」が『確率変数』です。

↑の感じが掴めたのなら、基本は理解できていると思います。






言い回しはなんか難しいですけど、要はこれだけの話になります。

要は名前の通り「確率を持った変数」のことなので。

(事象を一変数に落とし込む)




連続型だと「ここからここまで」みたいな範囲でやるやつとか。

例えば「一日の漁でとれる魚の重さ」とかを測るとき、

『確率変数』は「何キロ以上何キロ以下」になります。




いわゆる「離散型」は『自然数・整数』に対応してて、

「連続型」は『実数』に対応している感じです。

ざっと解説するとこんな感じですね。






厳密な定義


厳密な定義はちょっと堅苦しいです。



X:S→EX が確率変数

S : Sample Space

E : Event



結論だけで言うなら「関数」として定義されてます。

もっと具体的に言うなら、確率変数は「可測関数」です。



要するに、単に「データを数値にしたもの」なんですけど、

その振る舞いから厳密に定義するとこうなります。




どういうことかというと、

単純に「確率変数の振る舞い」から、

「標本空間」から「事象」を得てると分かるからです。



例えば↓みたいな感じに。

この時の「標本空間」を簡単に『 \{\mathrm{Yes},\,\mathrm{No}\} 』とします。



\displaystyle X(s)=\begin{cases}1 & \mathrm{if} & s=\mathrm{Yes} \\ 0 & \mathrm{if} & s=\mathrm{No} \end{cases}



より言葉を尽くすなら、

『試した結果を集めた集合(標本空間)』の中から、

『どれかを「一つにまとめて」抜き出してる』わけです。




『関数』の由来は「一つ抜き出す」というところから来てます。

そしてこの一つというのが、ちょっと厄介な部分になります。




というのも、別に『標本空間の部分集合』でも良いわけです。

『事象の定義』は、あくまで「要素」または「部分集合」なので。



具体的にサイコロの出目で考えても、個数を考えないなら、

その「事象」は「どれか一つが出る」としても良いですし、

「どれかが同時に出る」としても良いわけです。

(↑の例を参照)




こんな感じに、ともかく「ひとまとめ」にしてます。

もう一度言うなら『標本空間』を『事象』にしてるわけです。




そんなわけで「確率変数」はこんな感じに定義されてます。

もう一度確認しておくと↓みたいに。



X:S→E



そして再度確認しておきますが、

これは「単なる確率を持ったデータ(事象)を表す数」です。




例えば「確率を表す関数」を使うと↓みたいになります。

↑の「 2 択」の例を使うなら、



f_X(x)=\displaystyle \begin{cases}\displaystyle \frac{1}{2} & \mathrm{if} & x=1 \\ \displaystyle \frac{1}{2} & \mathrm{if} & x=0 \end{cases}



この「 X 」のことを『確率変数』と言います。

ごちゃごちゃしましたが、言いたいのはこれだけです。

いろんな情報を踏まえて、簡単に捉えましょう。