最尤推定 Maximum Likelihood, MLE


|| 一番それっぽい予測(母数を)のこと

「一番ほんとの値っぽい」ものを求めるやり方。

スポンサーリンク

 

 

 


目次

 

最尤推定の感じ「サンプリングした結果の再現率」

 

尤度関数「再現率を表す確率を導ける関数」

尤度方程式「再現率が最大になる時の推定量を求める関数」

 

 

 



 

これは『最もそれらしい確率』を求める操作のことで

「統計」においてかなり基礎的な操作になります。

 

\begin{array}{llllll} \displaystyle P(表)&≒&\displaystyle\frac{1}{2} \end{array}

 

具体的には、例えば

「確率が 1/2 じゃないコイン」とか

「確率が 1/6 じゃないサイコロ」とか

 

\begin{array}{llllll} \displaystyle P(表)&≠&\displaystyle\frac{1}{2} \end{array}

 

そういう「普通じゃない確率」の

『実際の確率を求めたい』時

 

\begin{array}{llllll} \displaystyle \displaystyle P(表)&=&\displaystyle\frac{k}{n} \end{array}

 

『最尤推定』が使われて

数学的にこのような結論を導いたりします。

 

 

 

 

 

具体的な感じ

 

詳しい話は後でするとして

例えばコイントスをした時に

100 回中 90 回」『表が出た』とすると

 

\begin{array}{llllll} \displaystyle P(表)&=&\displaystyle\frac{1}{2}&&? \\ \\ P(表)&=&\displaystyle\frac{90}{100}&&\mathrm{True}? \end{array}

 

まあ明らかな異常値ですから

この場合は「 1/2 で表が出る」とは思えません。

 

\begin{array}{llllll} \displaystyle P(表)&=&\displaystyle\frac{1}{2}&&\mathrm{False} \\ \\ P(表)&=&\displaystyle\frac{90}{100}&&\mathrm{True} \end{array}

 

こっちの方が正しい気がします。

 

 

この時に行った「 90/100

これが最尤推定の感覚で

 

 

最尤推定では

この感覚を厳密に取り扱っています。

 

 

 

 

 

最尤推定の操作

 

10 回中 9 回 表 が出た」とすると

『実際の確率と思われるもの』は

 

\begin{array}{llllll} \displaystyle P(表)&=&\displaystyle\frac{1}{2}&&? \\ \\ P(表)&=&\displaystyle\frac{9}{10}&&\mathrm{True}? \end{array}

 

だいたいこの2つだと言えます。

 

 

この時点では

これが最もそれっぽい結論なわけですが

 

 

まだこの段階では

『感覚的に最もそれっぽい』だけです。

厳密にそうと言えるわけではありません。

 

 

 

 

 

再現率による検証

 

↑ の感覚を厳密に取り扱いたい。

この要求に使えそうなのが「再現率」で

 

\begin{array}{llllll} \displaystyle P(表)&=& \displaystyle\frac{9}{10} &&? \end{array}

 

例えば「確率 1/2 で表が出る」と考えるなら

10 回中 9 回表が出る確率』は

 

\begin{array}{clllll} \displaystyle 表表表表表表表表表\textcolor{skyblue}{裏} &&\displaystyle \left(\frac{1}{2}\right)^9 \left(\frac{1}{2}\right)^1 \\ \\ 表表表表表表表表\textcolor{skyblue}{裏}表 &&\displaystyle \left(\frac{1}{2}\right)^9 \left(\frac{1}{2}\right)^1 \\ \\ \vdots \\ \\ \textcolor{skyblue}{裏}表表表表表表表表表 &&\displaystyle \left(\frac{1}{2}\right)^9 \left(\frac{1}{2}\right)^1 \end{array}

 

\begin{array}{llllll} \displaystyle \displaystyle {}_{10} \mathrm{C}_{9} \left(\frac{1}{2}\right)^9\left(\frac{1}{2}\right)^1 &=&\displaystyle 10\cdot\frac{1}{2^{10}} \\ \\ &≒&0.00977 &(0.98\%) \end{array}

 

このように表現できるので

『それがどれくらいの確率で正しいか』

数値で評価できます。

 

 

比較すればこれは明らかで

「確率 9/10 で表が出る」と考えれば

10 回中 9 回表が出る確率』は

 

\begin{array}{llllll} \displaystyle \displaystyle {}_{10} \mathrm{C}_{9} \left(\frac{9}{10} \right)^9\left(\frac{1}{10}\right)^1&=&\displaystyle 10\cdot\frac{9^9}{10^{10}} \\ \\ &=&(0.9)^9 \\ \\ &≒&0.387 &(38.7\%) \end{array}

 

このようになりますから

 

 

明らかに

「確率 1/2 である」という仮説よりも

「確率 9/10 である」という仮説の方が正しそうです。

 

 

 

 

 

操作の一般形と最大値

 

コインのような「 2 択」のもので考えてみた場合

『片方が出る確率を p 』として

取り出すサンプルの数を n とするなら

 

\begin{array}{llllll} \displaystyle f(x,p)&=&\displaystyle {}_n\mathrm{C}_x\cdot p^x(1-p)^{n-x} \end{array}

 

「片方が出た回数を x 」とすれば

『サンプリングの再現度』はこのように表現できます。

 

\begin{array}{llllll} \displaystyle \max\left( \displaystyle {}_n\mathrm{C}_x\cdot p^x(1-p)^{n-x} \right) \end{array}

 

ということはつまり

これが『最大値』をとる時

『サンプリングの再現度が最大になる』わけですから

 

\begin{array}{llllll} \displaystyle \frac{\partial f(x,p)}{\partial p}&=&0 \end{array}

 

その時にとる p

「一番それっぽい確率だ」と言えますよね。

 

 

 

 

 

とまあ最尤推定についてはこんな感じで

こういった関数を考えることによって

『最もそれっぽいもの』を求めます。

 

 

 


 


尤度関数 Likelihood Function

 

|| 最尤推定用の関数

「サンプルの数や出現回数」を『固定』した上で

『推定量(再現率)を求める』やつ

 

\begin{array}{llllll} \displaystyle f(x,θ_{\mathrm{est}})&=&{}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \\ \\ \mathrm{Lik}(θ_{\mathrm{est}}\,|\,x)&=&{}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

『分からない確率』を「推定量 θ_{\mathrm{est}} 」とします。

 

 

 

 

 

尤度関数の意味

 

初見じゃ分からんと思いますが

 

\begin{array}{llllll} \mathrm{Lik}(θ_{\mathrm{est}}\,|\,x)&=&{}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

この式の意味はそう難しいものではありません。

 

\begin{array}{llllll} \displaystyle {}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

これは先に話した『再現率』を表す関数です。

 

\begin{array}{llllll} \displaystyle \mathrm{Lik}(θ_{\mathrm{est}}\,|\,x) \end{array}

 

n 回中 x 回」事象が起きた。

これが「確率が θ_{\mathrm{est}} である」場合に起きる『確率』

 

\begin{array}{llllll} \displaystyle f(x \,|\, p) \end{array}

 

あるいは「確率が θ_{\mathrm{est}}=p である」

この時に「 n 回中 x 回」事象が起きる『確率』

 

\begin{array}{llllll} \displaystyle \displaystyle {}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

この2つの意味を持っていて、

先に確定させる方によって意味が変わります。

 

 

 

 

 

記号の意味

 

式が ↑ みたいになっているのは

「変数を減らしたい」「確率を扱う」

こういう要望と事実があったからで

 

\begin{array}{llllll} \displaystyle \mathrm{Lik}(θ_{\mathrm{est}}\,|\,x)&=&{}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

「条件付確率」で定義されているのは

それが都合が良かったからになります。

 

\begin{array}{llllll} \displaystyle \mathrm{Lik}(θ_{\mathrm{est}}\,|\,x) \end{array}

 

尤度関数は『確率を調べたい』ので

「変数 x が固定されている」のはそのため。

 

\begin{array}{llllll} \displaystyle \mathrm{Lik}(θ_{\mathrm{est}}\,|\,x)&=&{}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

まあつまり

これは「 x が確定している」上での

「確率が θ_{\mathrm{est}} である」場合の『確率』になります。

 

 

 

 

 

式の一般性

 

比較して見てみると

 

\begin{array}{llllll} \displaystyle \displaystyle \displaystyle {}_{10} \mathrm{C}_{9} \left(\frac{9}{10} \right)^9\left(\frac{1}{10}\right)^1 \\ \\ {}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

これが「いろんなことに使えるか」については

ちょっとどうなの?って感じがしませんか。

 

\begin{array}{llllll} \displaystyle {}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

なにせこの式は「2択の確率」を表現する式です。

 

θ_{\mathrm{est}}^x

 

ある「事象(コインの表が出るなど)」が

n 回の内 x 回起こる確率』を表しているだけで

 

\begin{array}{llllll} \displaystyle (1-θ_{\mathrm{est}})^{n-x} \end{array}

 

他の事象についての言及はありません。

「余事象(その事象以外が起きる)」で表現されていますが

その余事象の具体的な中身は不明なままです。

 

 

 

 

 

余事象の中身は見なくていい

 

「それ以外の事象(余事象)」の中身は

『ある事象(サイコロの目が1など)』が確定した後

 

\begin{array}{llllll} \displaystyle \displaystyle {}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

実は具体的に分解することなく扱っても

『再現率』を表現する上で特に問題は生じません。

 

\begin{array}{llllll} \displaystyle 1&1&2&&\displaystyle \left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right)^1 \\ \\ 1&1&3&&\displaystyle \left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right)^1 \\ \\ 1&2&1&&\displaystyle \left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right)^1 \\ \\ 1&3&1&&\displaystyle \left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right)^1 \\ \\ 2&1&1 &&\displaystyle \left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right)^1\\ \\ 3&1&1 &&\displaystyle \left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right)^1\end{array}

 

これは「3択」などで見てみると分かると思います。

 

\begin{array}{llllll} \displaystyle 6\left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right) \\ \\ \displaystyle 3\left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right)+3\left( \frac{1}{3} \right)^2\left( \frac{1}{3} \right) \\ \\ \displaystyle 3\left( \frac{1}{3} \right)^2\left( \frac{2}{3} \right) \end{array}

 

「1つの事象の再現率」

これは他をひとまとめにして扱ったとしても

 

\begin{array}{llllll} \displaystyle {}_3\mathrm{C}_2 \left( \frac{1}{3} \right)^2 A \\ \\ \displaystyle {}_3\mathrm{C}_2 \left( \frac{1}{3} \right)^2 B \end{array}

 

事象の確率が係数として確定している以上

特に問題なく求めることができます。

 

 


 

 


尤度方程式 Likelihood Equation

 

|| 扱いにくい掛け算を足し算にする感じ

「指数を排除して最大を求める」ための

『尤度関数についての一連の手続き』のこと。

 

\begin{array}{llllll} \displaystyle \frac{\partial}{\partial θ}\log_{e}\mathrm{Lik}(θ\,|\,x)&=&0 \end{array}

 

これは『大小比較』のテクニックの1つのようなもので

「指数」が絡む話を解決する手段になります。

 

 

 

 

 

指数が入る方程式

 

尤度関数によって『再現率』は計算できますが

「再現率の最大値」は求めるのが大変です。

 

\begin{array}{llllll} \displaystyle {}_n\mathrm{C}_x\cdot θ_{\mathrm{est}}^x(1-θ_{\mathrm{est}})^{n-x} \end{array}

 

方程式の中に「指数」が入っているせいで

どうしても計算が複雑になってしまいます。

 

\begin{array}{llllll} &?& \\ \\ \displaystyle 99^{100}&<&100^{99} \\ \\ \displaystyle 99^{100}&>&100^{99} \end{array}

 

実際、こういった数値の違いを求めたい時

これはそのまま扱うと大変なことになりますよね。

なので、どうにか簡単にしたいところ。

 

 

 

 

 

最大値と微分

 

『再現率の最大値を求めたい』時

使うのはもちろん「微分」なわけですが

 

\begin{array}{llllll} \displaystyle \frac{\partial}{\partial θ}\mathrm{Lik}(θ\,|\,x)&=&0 \end{array}

 

「尤度関数」をそのまま微分しても

 

\begin{array}{rlllll} \displaystyle \mathrm{Lik}(θ\,|\,x)&=&\displaystyle {}_n\mathrm{C}_x\cdot θ^x(1-θ)^{n-x} \\ \\ \\ \displaystyle \frac{\partial}{\partial θ}\mathrm{Lik}(θ\,|\,x)&=&\displaystyle \frac{\partial}{\partial θ}\Bigl( \displaystyle {}_n\mathrm{C}_x\cdot θ^x(1-θ)^{n-x} \Bigr) \\ \\ &=&\displaystyle {}_n\mathrm{C}_x \frac{\partial}{\partial θ}\Bigl( \displaystyle θ^x(1-θ)^{n-x} \Bigr) \end{array}

 

式が複雑過ぎてなんだかよくわかりません。

(通常の方程式を解くようには解けません)

 

 

 

 

 

関数の最大と指数の最大

 

指数関数 a^x を「微分」して

「極値(最大値など)」を求めようと思うと

 

\begin{array}{llllll} \displaystyle \frac{d}{dx}a^x&=&\displaystyle \lim_{h\to 0}\frac{a^{x+h}-a^x}{h} \\ \\ &=&\displaystyle a^x\log a \displaystyle \end{array}

 

解は指数に来るため

n 次方程式」として解くことはできません。

 

\begin{array}{llllll} \displaystyle a^x\log a&=&0 \end{array}

 

まあつまり「はっきりとした答え」を求められないので

このままでは『再現率の最大』を求めることができません。

 

\begin{array}{llllll} \displaystyle a<b&&⇒&&e^a<e^b \\ \\ a<b&&⇐&&e^a<e^b \end{array}

 

ここで出てくるのが「指数に注目する」考え方で

この『指数だけを取り出す』操作として

 

\begin{array}{llllll} \displaystyle a^x&=&b \\ \\ x&=&\log_a b \end{array}

 

\begin{array}{llllll} 3&=&2^{\log_2 3} \\ \\ a&=&e^{\log_e a} \\ \\ \displaystyle e^x&=&e^{\log_e e^x}\end{array}

 

「対数」という考え方が活躍します。

 

\begin{array}{llllll} \displaystyle \mathrm{Lik}(θ\,|\,x)&=&e^{\log_{e}\mathrm{Lik}(θ\,|\,x)} \end{array}

 

尤度方程式の形を見ればわかると思いますが

あの部分は「指数」を表す部分です。

 

 

 

 

 

指数と対数関数

 

「指数」に解が来る場合

微分してもうまく最大値を計算できませんが

 

\begin{array}{llllll} \displaystyle a<b&&⇒&&e^a<e^b \\ \\ a<b&&⇐&&e^a<e^b \end{array}

 

e>1 」である以上

「指数の大小」が比較できさえすれば

『元の関数の大小』は比較できるので

 

\begin{array}{llllll} \displaystyle \displaystyle \mathrm{Lik}(θ\,|\,x) \\ \\ \log_{e}\mathrm{Lik}(θ\,|\,x) \end{array}

 

指数法則を考えて

 

\begin{array}{llllll} \displaystyle 6&=&2^{\log_2 6} \\ \\ &=&2^{\log_2 2\cdot 3} \\ \\ \\ &=&2^{\log_2 2+\log_2 3} \\ \\ &=&2^{\log_2 2}2^{\log_2 3} \\ \\ &=&2\cdot 3 \end{array}

 

\begin{array}{llllll} \displaystyle 25&=&3^{\log_3 5^2} \\ \\ &=&3^{\log_3 5+\log_3 5} \\ \\ &=&3^{2\log_3 5} \end{array}

 

\begin{array}{llllll} \displaystyle \log_{e}ab&=&\log_{e}a+\log_{e}b \\ \\ \log_e a^x&=&\displaystyle x\log_e a \end{array}

 

尤度関数の最大を求めるために

『指数の最大』を求めてみれば

 

\begin{array}{llllll} \displaystyle\log_{e}\mathrm{Lik}(θ\,|\,x)&=& \displaystyle \log_{e}{}_n\mathrm{C}_x\cdot θ^x(1-θ)^{n-x} \end{array}

 

間接的にではありますが、

尤度関数の最大が求められるんじゃないか

みたいな予想を立てることができます。

 

 

 

 

 

対数尤度関数

 

指数法則の中でも

 

\begin{array}{llllll} \displaystyle \log_{e}ab&=&\log_{e}a+\log_{e}b \\ \\ \log_e a^x&=&\displaystyle x\log_e a \end{array}

 

特にこの2つの性質は非常に重要で

 

\begin{array}{llllll} \displaystyle \log_{e}\mathrm{Lik}(θ\,|\,x) \end{array}

 

尤度関数をこのような形にすると

 

\begin{array}{llllll} \displaystyle a^x&→&x\log a \\ \\ ab&→&\log a+\log b \end{array}

 

「指数」を『掛け算』に

「掛け算」を『足し算』に変換することができます。

 

\begin{array}{rlllll} \displaystyle \displaystyle \log_{e}{}_n\mathrm{C}_x\cdot θ^x(1-θ)^{n-x} \\ \\ θ^x(1-θ)^{n-x} \end{array}

 

\begin{array}{llllll} \displaystyle θ^x(1-θ)^{n-x} &→& \log θ^x + \log (1-θ)^{n-x} \end{array}

 

\begin{array}{llllll} \displaystyle \log θ^x&=&x\log θ \\ \\ \log (1-θ)^{n-x}&=&(n-x)\log (1-θ) \end{array}

 

そしてこの時に出てくる ↓ が

 

\begin{array}{llllll} \displaystyle \begin{array}{llllll} \displaystyle \log_{e}\mathrm{Lik}(θ\,|\,x) \end{array} \end{array}

 

「対数尤度関数」です。

 

 

 

 

 

尤度方程式の解

 

材料がそろったので

「尤度方程式」から

 

\begin{array}{llllll} \displaystyle \frac{\partial}{\partial θ}\log_{e}\mathrm{Lik}(θ\,|\,x)&=&0 \end{array}

 

『最尤推定量 θ 』を求めてみます。

 

\begin{array}{llllll} \displaystyle\log_{e}\mathrm{Lik}(θ\,|\,x)&=& \displaystyle \log_{e}{}_n\mathrm{C}_x\cdot θ^x(1-θ)^{n-x} \\ \\ &=&\displaystyle \log_{e}\frac{n!}{(n-x)!x!}θ^x(1-θ)^{n-x} \end{array}

 

\begin{array}{llllll} \displaystyle \log_{e}ab&=&\log_{e}a+\log_{e}b \end{array}

 

\begin{array}{llllll} \displaystyle\log_{e}\mathrm{Lik}(θ\,|\,x)&=&\log_{e}n!+\log_{e}((n-x)!)^{-1}+\log_{e}(x!)^{-1} \\ \\ &&+\log_{e}θ^x+\log_{e}(1-θ)^{n-x} \end{array}

 

パターン数を表している

 

\log_{e}n!+\log_{e}((n-x)!)^{-1}+\log_{e}(x!)^{-1}

 

この部分は「定数(変化しない)」なので

θ を変化させる偏微分」をする場合

「変化しない項」として消えてしまいます。

 

\begin{array}{llllll} \displaystyle\frac{\partial}{\partial θ}\log_{e}\mathrm{Lik}(θ\,|\,x)&=&\displaystyle\frac{\partial}{\partial θ} \Bigl( \log_{e}θ^x+\log_{e}(1-θ)^{n-x} \Bigr) \\ \\ &=&\displaystyle \frac{\partial}{\partial θ} \Bigl( x\log_{e}θ+(n-x)\log_{e}(1-θ) \Bigr) \end{array}

 

なので見るべき部分はここだけですから

この部分だけ整理していけばいいので

 

\begin{array}{llllll} \displaystyle \frac{\partial}{\partial θ}\log_{e}\mathrm{Lik}(θ\,|\,x)&=&\displaystyle \frac{\partial}{\partial θ}\Bigl( x\log_{e}θ+(n-x)\log_{e}(1-θ) \Bigr) \\ \\ &=&\displaystyle \displaystyle x\frac{\partial}{\partial θ}\log_{e}θ +\displaystyle (n-x)\frac{\partial}{\partial θ}\log_{e}(1-θ) \\ \\ &=&0 \end{array}

 

後は変形していけば導けそうです。

 

 

 

 

 

対数関数の微分

 

対数関数の微分は ↓ のようになります。

 

\begin{array}{llllll} \displaystyle \displaystyle \frac{d}{dx}\log_ex&=&\displaystyle\frac{1}{x} \end{array}

 

この証明は少し複雑ですが

 

\begin{array}{llllll} \displaystyle \log (x+h)-\log x&=&\displaystyle \log\frac{x+h}{x} \\ \\ &=&\displaystyle \log\left(1+\frac{h}{x}\right) \end{array}

 

\begin{array}{llllll} \displaystyle \frac{d}{dx}\log x&=&\displaystyle \lim_{h\to 0}\frac{\log (x+h)-\log x}{(x+h)-x} \\ \\ &=&\displaystyle \lim_{h\to 0}\frac{1}{h}\log\left(1+\frac{h}{x}\right)\end{array}

 

「ネイピア数 e (微分の単位)」を構成する

というちょっとだけ突飛な発想に至れば

 

\begin{array}{llllll} \displaystyle e&=&\displaystyle\lim_{n\to \infty}\left( 1+\frac{1}{n} \right)^n \\ \\ &=&\displaystyle\lim_{n\to 0}\left( 1+n \right)^{ \frac{1}{n}} \end{array}

 

\begin{array}{llllll} \displaystyle \left(1+\frac{h}{x}\right) &→&(1+k) \\ \\ \displaystyle\frac{1}{h}&→&\displaystyle\frac{1}{x}\frac{x}{h} &→&\displaystyle\frac{1}{x}\frac{1}{k} \end{array}

 

\begin{array}{llllll} h\to 0 &&⇒&&\displaystyle \frac{h}{x} \to 0 \end{array}

 

わりとすんなり導くことができます。

 

\begin{array}{llllll} \displaystyle \frac{d}{dx}\log x&=&\displaystyle \lim_{h\to 0}\frac{1}{h}\log\left(1+\frac{h}{x}\right) \\ \\ &=&\displaystyle \lim_{h\to 0}\frac{1}{x}\frac{x}{h}\log\left(1+\frac{h}{x}\right) \\ \\ \\ &=&\displaystyle \lim_{k\to 0}\frac{1}{x}\frac{1}{k} \log(1+k) \\ \\ &=&\displaystyle \lim_{k\to 0}\frac{1}{x} \log(1+k)^{\frac{1}{k}} \\ \\ \\ &=&\displaystyle \frac{1}{x}\log e \\ \\ &=&\displaystyle \frac{1}{x} \end{array}

 

結論がすごいシンプルなのが個人的にグッド。

 

 

 

 

 

最尤推定量

 

ここまでくれば後は作業です。

 

\begin{array}{llllll} \displaystyle \frac{dy}{dθ}&=&\displaystyle \frac{dy}{dt}\frac{dt}{dθ} \end{array}

 

\begin{array}{llllll} \displaystyle 1-θ&=&t \end{array}

 

微分の変数の置き換えさえ理解できていれば

 

\begin{array}{llllll} \displaystyle \frac{\partial}{\partial θ}\log_{e}\mathrm{Lik}(θ\,|\,x)&=&\displaystyle x\frac{\partial}{\partial θ}\log_{e}θ +\displaystyle (n-x)\frac{\partial}{\partial θ}\log_{e}(1-θ) \\ \\ &=&\displaystyle \frac{x}{θ}+(n-x)\frac{1}{t}(t)^{\prime} \\ \\ &=&\displaystyle \frac{x}{θ}+\frac{n-x}{1-θ} (-1)\\ \\ &=&0 \end{array}

 

後は単純な式変形を行っていくと

 

\begin{array}{llllll} \displaystyle \frac{x}{θ}+\frac{n-x}{1-θ} (-1)&=&0 \\ \\ \displaystyle \frac{x}{θ} &=&\displaystyle \frac{n-x}{1-θ} \end{array}

 

\begin{array}{llllll} \displaystyle x(1-θ)&=&(n-x)θ \\ \\ x-xθ&=&nθ-xθ \\ \\ \\ x&=&nθ \end{array}

 

\begin{array}{llllll} \displaystyle θ&=&\displaystyle \frac{x}{n} \end{array}

 

「最尤推定量 θ 」が求められます。

 

 

 

確認しておくと

n は「サンプリングしたサンプルの個数」

x 「ある結果が出た回数」です。

 

 

ということはつまり

100 回」の内「 90 回表が出た」なら

 

\begin{array}{llllll} \displaystyle \frac{x}{n} \end{array}

 

この時に『一番もっともらしい表が出る確率』は

90/100 である」ということになります。

 

 

 

計算自体はそれなりに複雑でしたが、

最終的に、人間の直観にマッチする結論に至った。

 

\begin{array}{llllll} \displaystyle \frac{\partial}{\partial θ}\log_{e}\mathrm{Lik}(θ\,|\,x)&=&0 \end{array}

 

\begin{array}{llllll} \displaystyle θ&=&\displaystyle \frac{x}{n} \end{array}

 

そう思うと

なんというか、不思議な気分になりませんか?