|| 同じ分布のデータは互いに不干渉だよ
これは「確率変数を別々に扱えるよ」という『仮定』です。
スポンサーリンク
これが仮定されていると、非常に計算がしやすくなります。
相関を考えなくて良いので、共分散などを使う必要がありません。
ただ、なにぶん『仮定』ですから、これが現実的とは限りません。
なにせ条件付き確率の発想から分かる通り、独立性は特別なものです。
といっても、そうそうおかしなことにはならないわけですけど。
『仮定』として使えるかの「判定の基準」はちゃんとあります。
ただこの辺は「自己相関」なんかの専門分野になるので、詳細は別で。
独立 Independent
特に「確率変数(データ)」の独立性について。
いわゆる『データとデータの間で影響が無い』感じ。
この厳密な定義は「条件付確率」で与えられてます。
簡単には「前のもの」と「後のもの」に影響が無いわけで。
つまりは↓だということです。
P(X_{con}|X_{pre})=P(X_{con})
「条件付確率」の定義から見れば、極端な話こういうことです。
事前の確率に事後の確率は左右されません。
詳細は「条件付確率」の記事で扱います。
同分布である Identically Distributed
「同じ分布(関数)に従う」という感じ。
要は『どっちも同じように確率分布(関数)の値を返すよ』って意味。
形式的には、とりあえず前提として、
二つ「確率変数 X_a,X_b 」を用意します。
この時点では、二つが同じ関数に従うとは限りません。
しかし、これらが「同分布である」
つまり『同じ分布に従う』なら、
『二つの変数が、確率分布(関数)で同じ確率を返す』わけです。
∀x∈I\,\left[\,P(x≥X_a)=P(x≥X_b)\,\right]
つまりは↑だということですね。
「 I 」は「区間」を表すものとします。