標本 Sample


|| 英訳の方が直感的

要は『調査して得たデータ』のことです。

そのデータを根拠に全体の性質を「推測」していきます。

スポンサーリンク




厳密には『全体(母集団)』の「部分集合」のことです。

部分といっても、まあほとんど『ほんの一部』になりますが。




このサンプルですが、基本的には『有限』です。

『無限のサンプル』なんて使えませんから、

限られた個数のサンプルから欲しい答えを得ます。



これによって、『無限』を扱わずに

『有限』個のものから全体像を得る感じですね。




もしくは単に「有限でも多すぎる」から、

「より少ない有限」個のサンプルで済ませるとか。






続いて、厄介な用語について見ていきましょう。

これは知ってないとどうしようもないやつです。

覚えるしかありません。







サンプル数 Number of Samples


|| 何個サンプリングしたかを表す回数のこと

要は「サンプルの数(標本数)」です。



ただ、これはちょっと適切な意味ではありません。

厳密に定めるなら『抽出(サンプリング)した回数』です。

「考えられるデータの全て」ではありません。




形式的には「確率変数 X_i 」で表されます。



サンプル(標本)を三個取り出された場合であれば、

X_1,X_2,X_3


となって、このとき「サンプル数」は『 3 』です。




具体例としては、

1000 人」の内「 100 人」から何か聞くなら、

この時のサンプル数は「 100 」になります。







サンプルサイズ Sample Size


|| データの中身の個数

「サンプリングする候補の個数」という感じ。

「確率変数が取り得る値の個数」とも言えます。




形式的には「確率変数の中身の個数」です。

確率変数を「集合」とみなせば、その『要素数』と言えます。




例えば「実際に取り出す」のが『 1 つ』でも、

その「サンプル X 」の『候補』が 100 個なら、

その「サンプルのサンプルサイズ」は 100 になります。




具体的には、例えば人間がたくさんいる場合

10000 人の内、 1 人だけをサンプリングするなら、

その一つのサンプルの「サンプルサイズ」は「 10000 」です。



またこの時、サンプル数は 1 になります。

似たような言葉ですが、明らかに違う意味を持ってます。

混同しないように注意しましょう。