|| 確率を扱う上で必要最低限になる前提
「集合」「完全加法族」「確率測度」のセット
スポンサーリンク
以下のように表現されますが
\begin{array}{cllllll} \displaystyle S&&\mathrm{Sample} \\ \\ σ_S &&\mathrm{Completely \,\, Additive} \\ \\ P&&\mathrm{Probability \,\, Measure} \end{array}
\begin{array}{llllll} \displaystyle (S,σ_S,P) \end{array}
まあ当然の話ですけど
この記号の表現よりも
これが保証してる内容の方が重要になります。
目次
確率「全ての事象の中でのある事象の割合」
コルモゴロフの公理「確率が持ってる最低限の性質」
完全加法族「普通の操作で矛盾が生じない保証」
標本空間「試行した結果全体の集合」
同様に確からしい「確率が全部同じという仮定」
事象「標本空間の部分集合」
確率測度「ある情報とその出現確率を対応付けるやつ」
確率変数「ある情報を数字に対応付けるやつ」
この記事の内容は
この辺りを知らないと意味わかんないと思います。
特に「集合」については
知らないとほとんど分かりません。
確率 Probability
|| 全体の中でどれだけあるか
全事象 U の中の事象 E の割合のこと
\begin{array}{llllll} \displaystyle E &&\mathrm{Event} \\ \\ U && \mathrm{Universe} &\mathrm{All \,\, Events} \end{array}
\begin{array}{llllll} \displaystyle p&=&\displaystyle \frac{|E|}{|U|} \end{array}
この感覚的な話から
『最低限の性質』を抜き出すことで
「確率空間」は形成されています。
コルモゴロフの公理 Kolmogorov
|| 確率が持ってる最低限の性質
確率なら持ってる 3 つの性質のこと
\begin{array}{cllllll} \displaystyle 0≤P(E)≤1 && \mathrm{Event} \\ \\ P(S)=1 && \mathrm{All \,\, Events } \\ \\ \\ \begin{array}{cllllll} \displaystyle A∩B=∅ \\ \\ ↓ \\ \\ \displaystyle P(A∪B)= P(A)+P(B) \end{array} && \mathrm{Completely \,\, Additive} \end{array}
最後の以外は直感的だと思います。
補足しておくと
\begin{array}{cllllll} \displaystyle A∩B=∅ &\to& \displaystyle P(A∪B)= P(A)+P(B) \end{array}
\begin{array}{llllll}\begin{array}{cllllll} \displaystyle i≠j \\ \\ E_i∩E_j=∅ \end{array} &\to& \displaystyle P\left( \bigcup_{n=1}^{\infty} E_n \right)=\sum_{n=1}^{\infty}P(E_n) \end{array}
これらは「完全加法性」という性質で
『普通の操作の無矛盾』を保証しています。
完全加法族 Completely Additivity
|| 普通の操作で矛盾が出ない保証
以下のあらゆる操作が無矛盾になります。
\begin{array}{llllll} \displaystyle\left( \begin{array}{llllll} \displaystyle S≠∅ \\ \\ σ⊂2^S \\ \\ A^c = S\setminus A \end{array} \right) &\to& \displaystyle \left( \begin{array}{rllllll} \displaystyle ∅∈σ \\ \\ S∈σ \\ \\ A∈σ &\to&A^c ∈σ \\ \\ A,B∈σ&\to&\displaystyle A\setminus B∈σ \\ \\ A_n∈σ &\to&\displaystyle\bigcup_{n=1}^{\infty}A_n ∈σ \\ \\ A_n∈σ &\to&\displaystyle\bigcup_{n=1}^{k}A_n ∈σ \\ \\ A_n∈σ &\to&\displaystyle\bigcap_{n=1}^{\infty}A_n ∈σ \\ \\ A_n∈σ &\to&\displaystyle\bigcap_{n=1}^{k}A_n ∈σ \end{array} \right) \end{array}
必要最低限の性質はこの中の3つだけですが
実態はこっちなのでこっちで覚えた方が良いです。
標本空間 Sample Space
|| 事象とかを厳密に定義するためのもの
試行した結果(確定した1つの事実)
その全てを要素に持つ集合 S のこと
\begin{array}{llllll} \displaystyle S&=&\{e_1,e_2,e_3,...,e_n\} \end{array}
\begin{array}{llllll} \displaystyle S_{\mathrm{coin}}&=&\{表,裏\} \\ \\ S_{\mathrm{coin}\times\mathrm{coin}}&=&\{表表,表裏,裏表,裏裏\} \\ \\ S_{\mathrm{dice}}&=&\{1,2,3,4,5,6\} \end{array}
具体的にはこういうのが「標本空間」で
\begin{array}{cllllll} 表&∈&S_{\mathrm{coin}} \\ \\ \displaystyle 1&∈&S_{\mathrm{dice}} \end{array}
この中の要素は「根源事象」と呼ばれます。
実数の範囲も標本空間になる
補足しておくと
\begin{array}{llllll} \displaystyle S_{\mathrm{interval}}&=&[0,1] \end{array}
こういうのも「標本空間」だと言えます。
(確率の定義が少し特殊になる)
ベルヌーイ試行
「試行した結果が 2 通り」の場合
\begin{array}{llllll} \displaystyle S_{\mathrm{coin}}&=&\{表,裏\} \\ \\ S_{\mathrm{True}}&=&\{\mathrm{True},\mathrm{False}\} \end{array}
この「 2 択の試行」には
「ベルヌーイ試行」なんて名前がついてます。
あらゆる例外が考えられる
例えばの話になりますが
「サイコロを1回ふる」場合
\begin{array}{llllll} \displaystyle S_{\mathrm{dice}}&=&\{1,2,3,4,5,6\} \end{array}
通常であればこの試行結果以外は考えませんが
実際には
「サイコロが壊れて目が分からなくなった」
「変な角度で止まったので 1 か 2 のどちらか」
\begin{array}{llllll} \displaystyle S_{\mathrm{dice}}&=&\{1,2,3,4,5,6\} \\ \\ S_{\mathrm{dice}}&=&\{1,2,3,4,5,6,×,1\,\mathrm{or}\,2\} \end{array}
確率は非常に低いながらも
こういった可能性は否定できません。
なのでより正確に確率を定めたいのなら
そういった可能性も考慮すべきなんですが
\begin{array}{llllll} \displaystyle P(\{×\})&≒&0 \end{array}
ほとんど起きない可能性というものは
「いくらでも考えられる」ので
正直、考えるだけ無駄というか
\begin{array}{llllll} \displaystyle S_{\mathrm{exception}}&=&\{×,1\,\mathrm{or}\,2,...\} \end{array}
全て「例外」として一括りにしたくなります。
例外が起きたら無視する
ここで「標本空間」の定義に戻ると
\begin{array}{llllll} S_{\mathrm{dice}}&=&\{1,2,3,4,5,6\} \end{array}
サイコロの試行の結果は
基本的にはこれなわけですが
\begin{array}{llllll} \displaystyle S_{\mathrm{universe}} &=&\{ e \mid e∈S_{\mathrm{dice}}∨e∈S_{\mathrm{exception}} \} \end{array}
より正確には
このような感じになっていて
\begin{array}{llcllll} \displaystyle P(\{e \mid e∈S_{\mathrm{dice}} \})&≒&1 \\ \\ P(\{e \mid e∈S_{\mathrm{exception}} \})&≒&0 \end{array}
それぞれの確率はこのようになっています。
で、この操作を見て分かると思いますが
\begin{array}{llllll} \displaystyle \{e \mid e∈S_{\mathrm{dice}} \} \\ \\ \{e \mid e∈S_{\mathrm{exception}} \} \end{array}
例外が起きなかった場合
例外が起きた場合
\begin{array}{llllll} \displaystyle \{e \mid e∈S_{\mathrm{dice}} \}∪\{e \mid e∈S_{\mathrm{exception}} \} \end{array}
まず最初にここで分岐して
「例外が起きなかった上での確率」としておけば
\begin{array}{llllll} \displaystyle \{e \mid e∈S_{\mathrm{dice}} \} \end{array}
「例外が起きなかった場合」のみを
このような形で定義できるので
結果として
これで例外を排除することができます。
(条件付き確率の考え方)
同様に確からしい
|| 確率を扱う上での基本的な仮定
根源事象の発生確率が全て同一である
\begin{array}{lclllll} P(\{e_1\})&=&\displaystyle\frac{1}{n} \\ \\ P(\{e_2\})&=&\displaystyle\frac{1}{n} \\ \\ &\vdots \\ \\ \displaystyle P(\{e_k\})&=&\displaystyle\frac{1}{n} \\ \\ &\vdots \\ \\ P(\{e_n\})&=&\displaystyle\frac{1}{n} \end{array}
確率を考える場合
\begin{array}{llllll} \displaystyle P(\{表\})&=&\displaystyle\frac{1}{2} \\ \\ P(\{裏\})&=&\displaystyle\frac{1}{2} \end{array}
あまり意識しませんが
これはほとんどの場合で前提として仮定されます。
事象 Event
|| 標本空間の要素の組み合わせ全体の一つ
標本空間で考えられるいろんな可能性のこと
\begin{array}{rrrrrrrrrrrrrrrlll} \displaystyle \{1\}&\{2\}&\{3\}&\{4\}&\{5\}&\{6\} \\ \\ &\{1,2\}&\{1,3\}&\{1,4\}&\{1,5\}&\{1,6\} \\ \\ &&\{2,3\}&\{2,4\}&\{2,5\}&\{2,6\} \\ \\ &&&\{3,4\}&\{3,5\}&\{3,6\} \\ \\ &&&&\{4,5\}&\{4,6\} \\ \\ &&&&&\{5,6\} \end{array}
\begin{array}{llllll} \displaystyle \{1,2,3\}&\{1,2,4\}&\{1,2,5\}&\{1,2,6\} \\ \\ &\{2,3,4\}&\{2,3,5\}&\{2,3,6\} \\ \\ &&\{3,4,5\}&\{3,4,6\} \\ \\ \{1,5,6\}&&&\{4,5,6\} \\ \\ \{1,4,6\}& \{1,4,5\}& & \\ \\ \{1,3,6\}&\{1,3,5\} & \{1,3,4\}& \\ \\ \{2,5,6\}&\{2,4,6\}&\{2,4,5\}&\{3,5,6\} \end{array}
\begin{array}{llllll} \displaystyle \{1,2,3,4\}&\{1,2,3,5\}&\{1,2,3,6\} \\ \\ \{1,2,4,5\}&\{1,2,4,6\}&\{1,2,5,6\} \\ \\ \{1,3,4,5\}&\{1,3,4,6\}&\{1,3,5,6\} \\ \\ &&\{1,4,5,6\} \\ \\ \{2,3,4,5\}&\{2,3,4,6\}&\{2,3,5,6\} \\ \\ &&\{2,4,5,6\} \\ \\ &&\{3,4,5,6\} \end{array}
\begin{array}{llllll} \displaystyle \{1,2,3,4,5\}&\{1,2,3,4,6\} \\ \\ \{1,2,3,5,6\}&\{1,2,4,5,6\}&\{1,3,4,5,6\} \\ \\ &&\{2,3,4,5,6\} \end{array}
\begin{array}{llllll} \displaystyle \{1,2,3,4,5,6\} \end{array}
「サイコロを1回ふる」場合の「標本空間」
その「事象」の「全体」はこのようになります。
具体的には
「 6 が出る」「 2 か 3 が出る」とか
\begin{array}{llllll} \displaystyle \{6\} \\ \\ \{2,3\} \end{array}
「偶数が出る」「 4,5,6 が出る」とか
\begin{array}{llllll} \displaystyle \{2,4,6\} \\ \\ \{4,5,6\} \end{array}
「 1 以外が出る」とか
\begin{array}{llllll} \displaystyle \{2,3,4,5,6\} \end{array}
「いずれかの目が出る」とか
\begin{array}{llllll} \displaystyle \{1,2,3,4,5,6\} \end{array}
こういう感じで表現されていて
見てわかる通り
「標本空間」は「全事象」になります。
標本空間と事象の厳密な定義
少し厳密な話をすると
「事象 E 」は「標本空間 S 」の『部分集合』
\begin{array}{llllll} \displaystyle E&⊆&2^S \end{array}
という形で定義されていて
\begin{array}{llllll} \displaystyle P(E)&=&p \\ \\ P(S)&=&1 \end{array}
確率を求める際には
このような形で表現されます。
注意点として
「実数」の範囲に関しては
\begin{array}{llllll} \displaystyle [a,b]&⊂&[0,1] \end{array}
単に「部分集合」と定義すると矛盾が出るので
「完全加法族」という条件がつきます。
確率測度 Probability Measure
|| 確率を返す関数とかの総称
『確率を返す測度 P 』のこと
\begin{array}{llllll} \displaystyle 0&≤&P(E)&≤&1 \end{array}
まあ要は「関数」のことで
\begin{array}{llllll} \displaystyle P(X≤L)&=&\displaystyle \sum_{x≤L}P(X=x) \\ \\ P(a<X≤b)&=&P(X≤b)-P(X≤a) \\ \\ &=&\displaystyle\int_{a}^{b}f_X(x) \,dx \end{array}
「確率分布」
こういうのが「確率測度」になります。
確率変数 Random Variable
|| 情報を数値に変換する手続き
ある情報を数字と対応付ける X のこと
\begin{array}{llllll} \displaystyle X(e)&:&\{5の目\}&\to&\{5\} \\ \\ X(e)&:&\{正解\}&\to&\{1\} \\ \\ X(e)&:&\{ダメ\}&\to&\{0\} \\ \\ X(e)&:&\{0以上1以下\}&\to&[0,1] \end{array}
具体的にはこんな感じのやつが確率変数で
\begin{array}{cllllll} \displaystyle X^{-1}(I)&⊂&S \\ \\ I&∈&R \\ \\ I\times I&∈&R^2 \end{array}
\begin{array}{ccccccccccccccllllll} \displaystyle X&:&X^{-1}(I)&\to&I \\ \\ X&:&X^{-1}(I^2)&\to&I^2 \end{array}
厳密には
\begin{array}{llllll} \displaystyle X&:&S&\to&R^n \end{array}
「確率変数」という概念は
このような「写像」として定義されています。
確率空間 Probability Space
|| 矛盾なく確率を扱える前提のこと
これは有限なら別に必要ないんですけど
\begin{array}{llllll} \displaystyle V&⊂&[0,1] \end{array}
「実数」の範囲を扱う場合
\begin{array}{llllll} \displaystyle 0&<&\displaystyle \displaystyle μ^* \left( \bigcup_{n=1}^{\infty} V+q_n \right) &<&\infty \end{array}
矛盾が生じることがあるため
(測度論の成果)
一般的に確率を扱う場合
\begin{array}{cllllll} \displaystyle S&&\mathrm{Sample} \\ \\ σ_S &&\mathrm{Completely \,\, Additive} \\ \\ P&&\mathrm{Probability \,\, Measure} \end{array}
\begin{array}{llllll} \displaystyle (S,σ_S,P) \end{array}
この「確率空間」という前提は必要になります。
\begin{array}{llllll} \displaystyle i≠j &&\to&& E_i∩E_j=∅ \end{array}
↓
\begin{array}{llllll} \displaystyle P\left( \bigcup_{n=1}^{\infty}E_n \right)&=&\displaystyle\sum_{n=1}^{\infty}P(E_n) \end{array}
当然過ぎてかなり緩そうですが
この条件がわりと強めなので。