独立同分布である i.i.d. IID


|| 同じ分布のデータは互いに不干渉だよ

これは「確率変数を別々に扱えるよ」という『仮定』です。

スポンサーリンク




これが仮定されていると、非常に計算がしやすくなります。

相関を考えなくて良いので、共分散などを使う必要がありません。




ただ、なにぶん『仮定』ですから、これが現実的とは限りません。

なにせ条件付き確率の発想から分かる通り、独立性は特別なものです。

といっても、そうそうおかしなことにはならないわけですけど。




『仮定』として使えるかの「判定の基準」はちゃんとあります。

ただこの辺は「自己相関」なんかの専門分野になるので、詳細は別で。






独立 Independent


特に「確率変数(データ)」の独立性について。

いわゆる『データとデータの間で影響が無い』感じ。




この厳密な定義は「条件付確率」で与えられてます。



簡単には「前のもの」と「後のもの」に影響が無いわけで。

つまりは↓だということです。


P(X_{con}|X_{pre})=P(X_{con})



「条件付確率」の定義から見れば、極端な話こういうことです。

事前の確率に事後の確率は左右されません。




詳細は「条件付確率」の記事で扱います。






同分布である Identically Distributed


「同じ分布(関数)に従う」という感じ。

要は『どっちも同じように確率分布(関数)の値を返すよ』って意味。




形式的には、とりあえず前提として、

二つ「確率変数 X_a,X_b 」を用意します。

この時点では、二つが同じ関数に従うとは限りません。



しかし、これらが「同分布である」

つまり『同じ分布に従う』なら、

『二つの変数が、確率分布(関数)で同じ確率を返す』わけです。



∀x∈I\,\left[\,P(x≥X_a)=P(x≥X_b)\,\right]



つまりは↑だということですね。

I 」は「区間」を表すものとします。