確率空間とかいう初見だと謎過ぎる概念について丁寧に解説してみた

|| 確率を扱う上で必要最低限になる前提

「集合」「完全加法族」「確率測度」のセット

以下のように表現されますが

$\begin{array}{cllllll} \displaystyle S&&\mathrm{Sample} \\ \\ σ_S &&\mathrm{Completely \,\, Additive} \\ \\ P&&\mathrm{Probability \,\, Measure} \end{array}$

$\begin{array}{llllll} \displaystyle (S,σ_S,P) \end{array}$

まあ当然の話ですけど

この記号の表現よりも

これが保証してる内容の方が重要になります。

確率 Probability

|| 全体の中でどれだけあるか

全事象 $U$ の中の事象 $E$ の割合のこと

$\begin{array}{llllll} \displaystyle E &&\mathrm{Event} \\ \\ U && \mathrm{Universe} &\mathrm{All \,\, Events} \end{array}$

$\begin{array}{llllll} \displaystyle p&=&\displaystyle \frac{|E|}{|U|} \end{array}$

この感覚的な話から

『最低限の性質』を抜き出すことで

「確率空間」は形成されています。

コルモゴロフの公理 Kolmogorov

|| 確率が持ってる最低限の性質

確率なら持ってる $3$ つの性質のこと

$\begin{array}{cllllll} \displaystyle 0≤P(E)≤1 && \mathrm{Event} \\ \\ P(S)=1 && \mathrm{All \,\, Events } \\ \\ \\ \begin{array}{cllllll} \displaystyle A∩B=∅ \\ \\ ↓ \\ \\ \displaystyle P(A∪B)= P(A)+P(B) \end{array} && \mathrm{Completely \,\, Additive} \end{array}$

最後の以外は直感的だと思います。

補足しておくと

$\begin{array}{cllllll} \displaystyle A∩B=∅ &\to& \displaystyle P(A∪B)= P(A)+P(B) \end{array}$

$\begin{array}{llllll}\begin{array}{cllllll} \displaystyle i≠j \\ \\ E_i∩E_j=∅ \end{array} &\to& \displaystyle P\left( \bigcup_{n=1}^{\infty} E_n \right)=\sum_{n=1}^{\infty}P(E_n) \end{array}$

これらは「加法性」という性質で

『普通の操作の無矛盾』を保証しています。

（厳密には無限の方の性質でこの公理は定められています）

完全加法族 Completely Additivity

|| 普通の操作で矛盾が出ない保証

以下のあらゆる操作が無矛盾になります。

$\begin{array}{llllll} \displaystyle\left( \begin{array}{llllll} \displaystyle S≠∅ \\ \\ σ⊂2^S \\ \\ A^c = S\setminus A \end{array} \right) &\to& \displaystyle \left( \begin{array}{rllllll} \displaystyle ∅∈σ \\ \\ S∈σ \\ \\ A∈σ &\to&A^c ∈σ \\ \\ A,B∈σ&\to&\displaystyle A\setminus B∈σ \\ \\ A_n∈σ &\to&\displaystyle\bigcup_{n=1}^{\infty}A_n ∈σ \\ \\ A_n∈σ &\to&\displaystyle\bigcup_{n=1}^{k}A_n ∈σ \\ \\ A_n∈σ &\to&\displaystyle\bigcap_{n=1}^{\infty}A_n ∈σ \\ \\ A_n∈σ &\to&\displaystyle\bigcap_{n=1}^{k}A_n ∈σ \end{array} \right) \end{array}$

必要最低限の性質はこの中の３つだけですが

実態はこっちなのでこっちで覚えた方が良いです。

標本空間 Sample Space

|| 事象とかを厳密に定義するためのもの

試行した結果（確定した１つの事実）

その全てを要素に持つ集合 $S$ のこと

$\begin{array}{llllll} \displaystyle S&=&\{e_1,e_2,e_3,...,e_n\} \end{array}$

$\begin{array}{llllll} \displaystyle S_{\mathrm{coin}}&=&\{表,裏\} \\ \\ S_{\mathrm{coin}\times\mathrm{coin}}&=&\{表表,表裏,裏表,裏裏\} \\ \\ S_{\mathrm{dice}}&=&\{1,2,3,4,5,6\} \end{array}$

具体的にはこういうのが「標本空間」で

$\begin{array}{cllllll} 表&∈&S_{\mathrm{coin}} \\ \\ \displaystyle 1&∈&S_{\mathrm{dice}} \end{array}$

この中の要素は「根源事象」と呼ばれます。

実数の範囲も標本空間になる

補足しておくと

$\begin{array}{llllll} \displaystyle S_{\mathrm{interval}}&=&[0,1] \end{array}$

こういうのも「標本空間」だと言えます。

（確率の定義が少し特殊になる）

ベルヌーイ試行

「試行した結果が $2$ 通り」の場合

$\begin{array}{llllll} \displaystyle S_{\mathrm{coin}}&=&\{表,裏\} \\ \\ S_{\mathrm{True}}&=&\{\mathrm{True},\mathrm{False}\} \end{array}$

この「 $2$ 択の試行」には

「ベルヌーイ試行」なんて名前がついてます。

あらゆる例外が考えられる

例えばの話になりますが

「サイコロを１回ふる」場合

$\begin{array}{llllll} \displaystyle S_{\mathrm{dice}}&=&\{1,2,3,4,5,6\} \end{array}$

通常であればこの試行結果以外は考えませんが

実際には

「サイコロが壊れて目が分からなくなった」

「変な角度で止まったので $1$ か $2$ のどちらか」

$\begin{array}{llllll} \displaystyle S_{\mathrm{dice}}&=&\{1,2,3,4,5,6\} \\ \\ S_{\mathrm{dice}}&=&\{1,2,3,4,5,6,×,1\,\mathrm{or}\,2\} \end{array}$

確率は非常に低いながらも

こういった可能性は否定できません。

なのでより正確に確率を定めたいのなら

そういった可能性も考慮すべきなんですが

$\begin{array}{llllll} \displaystyle P(\{×\})&≒&0 \end{array}$

ほとんど起きない可能性というものは

「いくらでも考えられる」ので

正直、考えるだけ無駄というか

$\begin{array}{llllll} \displaystyle S_{\mathrm{exception}}&=&\{×,1\,\mathrm{or}\,2,...\} \end{array}$

全て「例外」として一括りにしたくなります。

例外が起きたら無視する

ここで「標本空間」の定義に戻ると

$\begin{array}{llllll} S_{\mathrm{dice}}&=&\{1,2,3,4,5,6\} \end{array}$

サイコロの試行の結果は

基本的にはこれなわけですが

$\begin{array}{llllll} \displaystyle S_{\mathrm{universe}} &=&\{ e \mid e∈S_{\mathrm{dice}}∨e∈S_{\mathrm{exception}} \} \end{array}$

より正確には

このような感じになっていて

$\begin{array}{llcllll} \displaystyle P(\{e \mid e∈S_{\mathrm{dice}} \})&≒&1 \\ \\ P(\{e \mid e∈S_{\mathrm{exception}} \})&≒&0 \end{array}$

それぞれの確率はこのようになっています。

で、この操作を見て分かると思いますが

$\begin{array}{llllll} \displaystyle \{e \mid e∈S_{\mathrm{dice}} \} \\ \\ \{e \mid e∈S_{\mathrm{exception}} \} \end{array}$

例外が起きなかった場合

例外が起きた場合

$\begin{array}{llllll} \displaystyle \{e \mid e∈S_{\mathrm{dice}} \}∪\{e \mid e∈S_{\mathrm{exception}} \} \end{array}$

まず最初にここで分岐して

「例外が起きなかった上での確率」としておけば

$\begin{array}{llllll} \displaystyle \{e \mid e∈S_{\mathrm{dice}} \} \end{array}$

「例外が起きなかった場合」のみを

このような形で定義できるので

結果として

これで例外を排除することができます。

（条件付き確率の考え方）

同様に確からしい

|| 確率を扱う上での基本的な仮定

根源事象の発生確率が全て同一である

$\begin{array}{lclllll} P(\{e_1\})&=&\displaystyle\frac{1}{n} \\ \\ P(\{e_2\})&=&\displaystyle\frac{1}{n} \\ \\ &\vdots \\ \\ \displaystyle P(\{e_k\})&=&\displaystyle\frac{1}{n} \\ \\ &\vdots \\ \\ P(\{e_n\})&=&\displaystyle\frac{1}{n} \end{array}$

確率を考える場合

$\begin{array}{llllll} \displaystyle P(\{表\})&=&\displaystyle\frac{1}{2} \\ \\ P(\{裏\})&=&\displaystyle\frac{1}{2} \end{array}$

あまり意識しませんが

これはほとんどの場合で前提として仮定されます。

事象 Event

|| 標本空間の要素の組み合わせ全体の一つ

標本空間で考えられるいろんな可能性のこと

$\begin{array}{rrrrrrrrrrrrrrrlll} \displaystyle \{1\}&\{2\}&\{3\}&\{4\}&\{5\}&\{6\} \\ \\ &\{1,2\}&\{1,3\}&\{1,4\}&\{1,5\}&\{1,6\} \\ \\ &&\{2,3\}&\{2,4\}&\{2,5\}&\{2,6\} \\ \\ &&&\{3,4\}&\{3,5\}&\{3,6\} \\ \\ &&&&\{4,5\}&\{4,6\} \\ \\ &&&&&\{5,6\} \end{array}$

$\begin{array}{llllll} \displaystyle \{1,2,3\}&\{1,2,4\}&\{1,2,5\}&\{1,2,6\} \\ \\ &\{2,3,4\}&\{2,3,5\}&\{2,3,6\} \\ \\ &&\{3,4,5\}&\{3,4,6\} \\ \\ \{1,5,6\}&&&\{4,5,6\} \\ \\ \{1,4,6\}& \{1,4,5\}& & \\ \\ \{1,3,6\}&\{1,3,5\} & \{1,3,4\}& \\ \\ \{2,5,6\}&\{2,4,6\}&\{2,4,5\}&\{3,5,6\} \end{array}$

$\begin{array}{llllll} \displaystyle \{1,2,3,4\}&\{1,2,3,5\}&\{1,2,3,6\} \\ \\ \{1,2,4,5\}&\{1,2,4,6\}&\{1,2,5,6\} \\ \\ \{1,3,4,5\}&\{1,3,4,6\}&\{1,3,5,6\} \\ \\ &&\{1,4,5,6\} \\ \\ \{2,3,4,5\}&\{2,3,4,6\}&\{2,3,5,6\} \\ \\ &&\{2,4,5,6\} \\ \\ &&\{3,4,5,6\} \end{array}$

$\begin{array}{llllll} \displaystyle \{1,2,3,4,5\}&\{1,2,3,4,6\} \\ \\ \{1,2,3,5,6\}&\{1,2,4,5,6\}&\{1,3,4,5,6\} \\ \\ &&\{2,3,4,5,6\} \end{array}$

$\begin{array}{llllll} \displaystyle \{1,2,3,4,5,6\} \end{array}$

「サイコロを１回ふる」場合の「標本空間」

その「事象」の「全体」はこのようになります。

具体的には

「 $6$ が出る」「 $2$ か $3$ が出る」とか

$\begin{array}{llllll} \displaystyle \{6\} \\ \\ \{2,3\} \end{array}$

「偶数が出る」「 $4,5,6$ が出る」とか

$\begin{array}{llllll} \displaystyle \{2,4,6\} \\ \\ \{4,5,6\} \end{array}$

「 $1$ 以外が出る」とか

$\begin{array}{llllll} \displaystyle \{2,3,4,5,6\} \end{array}$

「いずれかの目が出る」とか

$\begin{array}{llllll} \displaystyle \{1,2,3,4,5,6\} \end{array}$

こういう感じで表現されていて

見てわかる通り

「標本空間」は「全事象」になります。

標本空間と事象の厳密な定義

少し厳密な話をすると

「事象 $E$ 」は「標本空間 $S$ 」の『部分集合』

$\begin{array}{llllll} \displaystyle E&\in&2^S \end{array}$

という形で定義されていて

$\begin{array}{llllll} \displaystyle P(E)&=&p \\ \\ P(S)&=&1 \end{array}$

確率を求める際には

このような形で表現されます。

注意点として

「実数」の範囲に関しては

$\begin{array}{llllll} \displaystyle [a,b]&⊂&[0,1] \end{array}$

単に「部分集合」と定義すると矛盾が出るので

「完全加法族」という条件がつきます。

確率測度 Probability Measure

|| 確率を返す関数とかの総称

『確率を返す測度 $P$ 』のこと

$\begin{array}{llllll} \displaystyle 0&≤&P(E)&≤&1 \end{array}$

まあ要は「関数」のことで

$\begin{array}{llllll} \displaystyle P(X≤L)&=&\displaystyle \sum_{x≤L}P(X=x) \\ \\ P(a<X≤b)&=&P(X≤b)-P(X≤a) \\ \\ &=&\displaystyle\int_{a}^{b}f_X(x) \,dx \end{array}$

「確率分布」

「累積分布関数」「確率密度関数」

こういうのが「確率測度」になります。

確率変数 Random Variable

|| 情報を数値に変換する手続き

ある情報を数字と対応付ける $X$ のこと

$\begin{array}{llllll} \displaystyle X(e)&:&\{5の目\}&\to&\{5\} \\ \\ X(e)&:&\{正解\}&\to&\{1\} \\ \\ X(e)&:&\{ダメ\}&\to&\{0\} \\ \\ X(e)&:&\{0以上1以下\}&\to&[0,1] \end{array}$

具体的にはこんな感じのやつが確率変数で

$\begin{array}{cllllll} \displaystyle X^{-1}(I)&⊂&S \\ \\ I&∈&R \\ \\ I\times I&∈&R^2 \end{array}$

$\begin{array}{ccccccccccccccllllll} \displaystyle X&:&X^{-1}(I)&\to&I \\ \\ X&:&X^{-1}(I^2)&\to&I^2 \end{array}$

厳密には

$\begin{array}{llllll} \displaystyle X&:&S&\to&R^n \end{array}$

「確率変数」という概念は

このような「写像」として定義されています。

確率空間 Probability Space

|| 矛盾なく確率を扱える前提のこと

これは有限なら別に必要ないんですけど

$\begin{array}{llllll} \displaystyle V&⊂&[0,1] \end{array}$

「実数」の範囲を扱う場合

$\begin{array}{llllll} \displaystyle 0&<&\displaystyle \displaystyle μ^* \left( \bigcup_{n=1}^{\infty} V+q_n \right) &<&\infty \end{array}$

矛盾が生じることがあるため

（測度論の成果）

一般的に確率を扱う場合