最小作用の原理／変分原理とかいうやつについてめちゃくちゃ丁寧に掘り下げて解説してみた

|| 隙間を埋めるためのもの

これの役割は「2点間の物質の移動経路の予測」です。

量子力学では波動関数を定める根拠になってます。

変分原理／最小作用の原理

|| 実現される運動は、限られている

簡単に言うと『状態の変化は最短で行われる』っていう、

物理における基本原理の１つの話です。

もうちょっと砕けた感じで言うなら、

「最短以外の移動は起きないとする保証」って感じ。

具体的には「光」とか見ると分かり易くて、

こいつは『真っすぐにしか進まない』じゃないですか。

要はまあ、そういう話です。

て言っても、なんでその保証がいるの？と、

そう感じる人もいると思います。

少なくとも私はそう思ったんですけど、

よくよく考えてみると、なんか分かる気がしませんか？

というのも、

例えば「エネルギーの状態が確定」していて、

その「エネルギーの状態が変わった後も確定」している時、

その『中間での物質の位置／動き』の、

『変化の仕方／パターン』ってのは、

「無数に考えられる」じゃないですか。

あくまで「考えられるだけ」ですけど、

人間が観測するのは基本的に「点」になるので、

『見えてない中間』はよく分かりません。

実はぐにゃぐにゃに曲がってからその状態に行き着いてたり、

他にも1度別のものになって、元の状態に戻ってたり、

いろいろ想像はできるじゃないですか。

でも、例えばものを落とすと、

特に力を受けないなら、直線的に落ちますよね？

移動経路はぐしゃぐしゃになってないし、

すごく細かく２点をとって見ても、

ほぼ直線の移動しかしていないはずです。

他にも、例えば多少の勾配がある斜面にしても、

ものを転がせば、基本的に「地面に沿った状態」で、

『最短経路を通って』下っていきます。

その経路の全体を見ても、

いきなり逆走してる部分があったり、

突然真上に飛んでったりしてる部分はありません。

そう、このような「見えない中間」である

落下軌道、移動経路には、

ちゃんと規則性があるんですよ。

でまあ、それは明らかな事実ですから、

変分原理っていう名前が付いてるんですね。

まとめると、単なる事実として、

「無秩序にものは移動しない」し、

「限られた経路を通る」ことは実験から明らか。

だから、それを原理として保証する。

言ってしまえば、これはそれだけの話になります。

まあ、数学的な定義はややこしいんですが。

これの数学的な説明には

『微分の意味』と『変分法』の知識が必要なので、

先にそれから説明して、その後に詳しく説明していきます。

微分の意味

微分って聞くと難しく聞こえるかもしれませんが、

これはただの『変化量を求める操作』です。

$\begin{array}{rlc} \displaystyle f^{\prime}(x)&=\displaystyle \frac{dy}{dx} \\ \\ &=\displaystyle \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x} \end{array}$

意外と簡単なんですよ、これ。

「傾き・比例定数」とかを求める時に使うんですけど、

基本は『直線』だけ考えていればよくて、

複雑に考える必要はありません。

$\begin{array}{rlc} \displaystyle y&=f(x) \\ \\ &=ax+b \end{array}$

$\begin{array}{rlc} \displaystyle \frac{f(x_2)-f(x_1)}{x_2-x_1} &= \displaystyle \frac{(ax_2+b)-(ax_1+b)}{x_2-x_1} \\ \\ &=\displaystyle \frac{a(x_2-x_1)}{x_2-x_1} \\ \\&=a \end{array}$

というのも、やってることはこれだけなんですよ。

$\begin{array}{rlc} \displaystyle f^{\prime}(x)&=\displaystyle \frac{dy}{dx} \\ \\ &=\displaystyle \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x} \end{array}$

$dx,dy$ の記号の意味がよく分かんないだけで、

操作自体はすごく単純なんです。

加えて、基本的に $x,y$ の $2$ 次元だけ考えてればよくて、

それ以上の次元を考える必要はありません。

$\displaystyle \frac{f(x_2)-f(x_1)}{x_2-x_1}$

ただただ、↑の操作をしてるだけ。

余計なものはこの範囲を広げてるだけで、

それ以上の意味は特にありません。

まあとりあえず、

説明のために記号を定めておきましょうか。

$\begin{array}{rlc} \displaystyle x&=x \\ \\ y&=f(x) \end{array}$

これを基にして、まずは微分でいきなり出てくる

「ちょっとの変化量 $dx,dy$ 」

この記号の意味について説明していきます。

極限の感覚

$dx,dy$ を説明するために、

微分の根幹を成す操作である

『極限』について、ざっと説明しておきます。

$\displaystyle \lim_{h→a} h = a$

名前も見た目も厳ついですけど、

これも実はそんなに難しいものではありません。

というのも、

これはただ『近づけてる』だけなんですよ。

「代入」と混同されがちなんですけど、

これは「変数に値を入れる操作」ではなく、

『変数の値を変化させていく操作』なので、

『近づける』って感覚を意識してみると、

根本的に異なることが分かると思います。

$\displaystyle \lim_{h→a} h = a$

意味で考えるともっと分かりやすくて、これは

『→の値 $a$ になる、というわけではなく』

『→の値 $a$ に、限りなく近づく』ってことを表してます。

まあつまり「その値になるわけではない」

ってことが、これではっきり分かるわけですね。

この部分、かなり重要なので忘れないでください。

念のため厳密な話をしておくと、

極限が求めてるのは『下限・上限』になります。

$\begin{array}{rlc} x&>0 \\ \\ \displaystyle\lim_{x→0}x&=0 \end{array}$

なので、範囲に $0$ が無い状態でも、

こういう風に書くことが許されるんですよ。

微小変化量 $dx,dy$ の感覚

$dx,dy$ ってのを考える理由は、

『超近くで曲線を見た時のため』って感じでしょうか。

どういうことかというと、

『曲線が直線に見える近さ』というような、

『変化が一定に近い領域に近づける』時、

「ほぼ $0$ の変化量」を考える必要がある、って話です。

$\begin{array}{rlc} dx&=\displaystyle \lim_{h→0} (x+h)-x \\ \\ &=0 \\ \\ \\ dy&=\displaystyle \lim_{h→0}f(x+h)-f(x) \\ \\ &=0 \end{array}$

この $dx,dy$ が『微小変化量』って言われているもので、

「曲線の傾きを求めたい」時とか、

「極細の長方形の面積を求めたい」時に必要になります。

前者は微分ですね。

『直線的に求めることが出来るよう』に、

『曲線の変化量／傾き』を↓みたいに考えます。

$\begin{array}{rlc} \displaystyle \displaystyle f^{\prime}(x)&\displaystyle =\frac{d}{dx}f(x)\\ \\&\displaystyle=\frac{dy}{dx} \\ \\ &\displaystyle =\lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x} \end{array}$

この「 $f^{\prime}(x)$ 」が『微分された関数』ですね。

んで、後者は積分になります。

これは『超細い長方形の面積 $dS$ 』を考えるやり方ですね。

$\begin{array}{rlc} S_0&=f(x+0)×1 \\ \\ S_1&=f(x+1)×1 \\ \\ S_2&=f(x+2)×1 \\ \\ \vdots \\ \\ S_0+S_1+S_2+\cdots+S_n&=S \end{array}$

$\begin{array}{rlc} \displaystyle dS&=f(x)\,dx \\ \\ f(x_1)dx+f(x_1+dx)dx+\cdots+f(x_2-dx)dx&=\displaystyle \int_{x_1}^{x_2} dS \\ \\ &=S \end{array}$

はい、とまあこういうのを考える時、

『微小変化量 $dx$ 』が必要になるわけです。

微小変化量と微分

やってることは『直線の傾きを求める』のと同じで、

例えば「２つの点を結んだ直線の傾き $a$ 」は、

$\begin{array}{rlc} \displaystyle \frac{f(x_2)-f(x_1)}{x_2-x_1} &=\displaystyle \frac{(ax_2+b)-(ax_1+b)}{x_2-x_1} \\ \\ &=a \end{array}$

こうなるじゃないですか。

んで、『微分』の操作ってのは、

この「点と点の間隔」を『ほぼ $0$ にしてる』だけで、

やってることはそっくりそのまま。

$\displaystyle \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x}=f^{\prime}(x)$

比較して見てみると、

明らかに同様の操作だと分かります。

$\begin{array}{rlc} \displaystyle \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x}&=f^{\prime}(x) \\ \\ \displaystyle \frac{f(x_2)-f(x_1)}{x_2-x_1}&=a \end{array}$

念のため確認しておくと、

これは「 $0$ にしているわけではない」って点に注意。

これは「ほぼ $0$ に近づける」と、

『無視しても特に問題が無い』って感じの操作で、

「 $0$ にしている操作」ではありません。

あくまで『結果的に $0$ に限りなく近い』だけで、

代入とは根本的に異なるので、混同しないように。

話は戻って、ともかくこのようにすると、

『直線以外』でも「傾き」が考えられるようになります。

具体的には↓みたいに。

$f(x)=x^2$

$\begin{array}{rlc} \displaystyle f^{\prime}(x)&\displaystyle =\lim_{h→0}\frac{(x+h)^2-x^2}{(x+h)-x} \\ \\ &\displaystyle =\lim_{h→0}\frac{x^2+2hx+h^2-x^2}{h} \\ \\ \\ &\displaystyle =\lim_{h→0}\frac{2hx+h^2}{h} \\ \\ &\displaystyle =\lim_{h→0}2x+h \\ \\ &=2x \end{array}$

$f(x)$ の「接線 $y$ の傾き $f^{\prime}(a)$ 」は、

「点 $x=1$ 」の時は↓に。

$\begin{array}{rll} x=1&→&f(1)=1 \end{array}$

$\begin{array}{rlc} \displaystyle y-1&\displaystyle =\lim_{h→0}\frac{(1+h)^2-1^2}{(1+h)-1}(x-1) \\ \\ &=2(x-1) \end{array}$

具体的な値を入れるとこうなります。

見た目厳ついですけど、どうですか？

そんな難しくないですよね。

変分法

これは『最短経路』を考えるための方法です。

かなり脳筋な発想になります。

というのもこれは、

まず『全ての経路を変数に持つ関数』を用意して、

「極値（最小値など）を見つける」ってやり方なんです。

「２点間の最短経路を求める問題」

みたいな問題を解くときに使われるんですが、

聞いての通り、だいぶ無茶なやり方です。

てなわけで厳密な話をしていくと、

これは『経路 $f(x)$ の到達時間 $T(y)$ 』を考えて、

その『極値を求める条件 $T^{\prime}(f(x))=0$ 』を考える。

$\begin{array}{rlc} \displaystyle y&=f(x) \\ \\ r^2&=x^2+y^2 \\ \\ v&\displaystyle =\frac{dr}{dt} \\ \\ &\displaystyle =\sqrt{\left(\frac{dx}{dt}\right)^2+\left(\frac{dy}{dt}\right)^2} \\ \\ &\displaystyle =\left(\frac{dx}{dt}\right)\sqrt{1+\left(\frac{dy}{dx}\right)^2} \\ \\ \\ dt&\displaystyle =\frac{dt}{dx}dx \\ \\ &\displaystyle =\frac{\sqrt{1+\left(\displaystyle\frac{dy}{dx}\right)^2}}{v} \,dx \\ \\ \\ T&=\displaystyle \int_{0}^{T} dt&\displaystyle \\ \\ &\displaystyle =\int_{0}^{α} \frac{\sqrt{1+\left(\displaystyle\frac{dy}{dx}\right)^2}}{v} \,dx \end{array}$

具体的にはこんな感じに式変形して、

強引に『到達時間についての関数 $T$ 』を求めることで、

その関数の「極値（最小値とか）の条件」から、

「最も短い経路を見つけ出す」って感じです。

↑のやつは速度とか座標とか、

よく使う単位で書いてますが、

変数を変えれば別の解釈をすることもできます。

再度確認しておくと、

「２点間の経路」ってのはいくつもあります。

当然、経路によっては到達時間もまちまちです。

んで、変分法っていうのは、

その中で「極値の条件を満たすもの」を探して、

『最小の経路』を見つけます。

やってることは、高校で習った

『最小・最大値を見つける』のとそんなに差はありません。

はい、とまあ大枠としてはこんな感じ。

この辺り、忘れないようにしてください。

ただまあ、これだと抽象的過ぎますよね。

具体的なやつを見てみたくないですか？

というわけで、代表的な問題である

『最速降下曲線』ってやつの解説をしてみようと思います。

最速降下曲線の導出

「物質が $2$ 点間を最速で滑り降りる」ための、

『図形』についての、代表的な話がこれ。

「最小作用の原理」の、

『数学的な定義』を理解するには、

これを導く時の考え方が必要になります。

てなわけで問題の具体的な内容なんですけど、

まず「 $2$ つの離れた点 $O,P$ 」を考えます。

$\begin{array}{rlc} \displaystyle O=(0,0) \\ \\ \\ &P=(a,b) \end{array}$

問題を単純にするために、

値の正負を定めておきましょうか。

$a>0,b>0$

図形の横軸は $x$ 軸の正方向を→とする

図形の縦軸は $y$ 軸の正方向を↓とする

別に「 $b<0$ 」でもいいんですけど、

$-$ を排除したいのでこうしておきます。

重力 $mg$ の方向についても、

$y$ 軸に沿った方向にしておきます。

まあつまり $y>0$ なら重力は $+$ に。

ちなみに摩擦は考えません。

そして次、メインとなる『時間』も考えてみます。

そうすると、

『滑り落ちるものの速度は一定じゃない』っていう、

重力を受けて加速してる事実を考慮する必要が。

んでまあこういう風に現実の落下を考慮して、

「速度 $v(y)$ 」を計算しておくと、

エネルギー保存則から導くことが。

高さ $y$ ・初速 $v(0)=0$ とします。

$\begin{array}{rlc} \displaystyle \frac{1}{2}mv^2(0)+mg(a-0)&\displaystyle =\frac{1}{2}mv^2(y)+mg(a-y) \\ \\ \displaystyle mga&\displaystyle =\frac{1}{2}mv^2(y)+mg(a-y) \\ \\ \\ \displaystyle ga&\displaystyle =\frac{1}{2}v^2(y)+g(a-y) \\ \\ \displaystyle ga-g(a-y)&\displaystyle =\frac{1}{2}v^2(y) \\ \\ \displaystyle gy&\displaystyle =\frac{1}{2}v^2(y) \end{array}$

$v(y)=\sqrt{2gy}$

これは見覚えがあるかと。

単純な式変形ですぐに求まります。

速度

「速度」を表す方法は、実はいくつかあります。

具体的には『位置 $y$ でみるやり方』と、

『時間 $t$ でみるやり方』の２つがあるんですよ。

$v=\sqrt{2gy}$

↑で求めたのは「 $y$ から見た速度」で、

意味は『位置 $y$ での速度』です。

重力による加速の方向は一方向のみですから、

このように書くことができるのは分かるかと。

とはいえ速度ですから、

移動距離の長さを $l$ とすると、

$\displaystyle v=\frac{dl}{dt}$

『時間 $t$ での速度』として、

このような表現も考えられますよね？

これはまあ、そういう話です。

というわけで「速度」について、

少し整理しておきます。

まず「長さ $l$ 」を考えてみましょうか。

この部分、よく分かりませんし。

といっても求める方法は簡単で、

ただ「三平方の定理」を使うだけで求まります。

$\begin{array}{rlc} \displaystyle l^2&=x^2+y^2 \end{array}$

直線の場合はこう。

となると、これを曲線で考える場合、

$\begin{array}{rlc} dl&=\displaystyle \sqrt{dx^2+dy^2} \\ \\ &=\displaystyle \sqrt{dx^2+df^2(x)} \end{array}$

このようにすれば、

近い距離で成立します。

ここの部分はまだよく分かんないと思いますが、

軌跡 $y=f(x)$ の部分は、

$\displaystyle f^{\prime}(x)=\frac{df(x)}{dx}$

この関係を考慮して、

位置の変化量 $dx$ を取り出しておきます。

$\begin{array}{rlc} \displaystyle \sqrt{dx^2+df^2(x)}&\displaystyle =\displaystyle \sqrt{dx^2+dx^2\left( \frac{df(x)}{dx}\right)^2 } \\ \\ &\displaystyle =\displaystyle dx\sqrt{1+\left( \frac{df(x)}{dx}\right)^2 } \end{array}$

これは後で「変数を減らすための操作」だと分かるんですけど、

この時点ではノーヒントなので、今はスルーで。

一応、長さについて書いておくと、

「範囲 $0\leqx$ での和」をとればいいので、

$l=\displaystyle \int_{0}^{x}\sqrt{1+\left( \frac{df(x)}{dx}\right)^2 }\,dx$

こうなるのが分かるかと。

意味的には「超短い接線の集まり」って感じ。

ともかく、長さは↑なので、

「時間変化での速度」は↓になります。

$\begin{array}{rlc} \displaystyle \frac{dl(x)}{dt}&\displaystyle =\frac{\displaystyle \sqrt{1+\left( \frac{df(x)}{dx}\right)^2 }\,dx}{dt} \\ \\ &\displaystyle =\displaystyle \sqrt{1+(f^{\prime}(x))^2 }\frac{dx}{dt} \end{array}$

はい、とまあこんな感じにすれば、

『時間と長さ』で「速度」を表現できます。

到達時間についての関数

「最短になる経路」を求めるために、

『到達時間の関数』を求めてみます。

とりあえず式を整理していきましょうか。

$\begin{array}{rlc} \displaystyle v&\displaystyle =\sqrt{2gy} \\ \\ v&\displaystyle =\sqrt{1+(f^{\prime}(x))^2 }\,\frac{dx}{dt} \end{array}$

これから「到達時間の関数 $T$ 」を作ってみます。

そのために、とりあえず式変形。

$\begin{array}{rlc} \displaystyle \sqrt{2gy} &\displaystyle = \sqrt{1+(f^{\prime}(x))^2 }\,\frac{dx}{dt} \\ \\ \displaystyle \frac{\sqrt{2gy}}{\sqrt{1+(f^{\prime}(x))^2 }} &\displaystyle = \frac{dx}{dt} \end{array}$

するとまあこうなります。

んで次、「時間についての関数」を得るために、

$y$ 軸と $t$ 軸を入れ替えてみると、

$\displaystyle \frac{dt}{dx}=\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}$

このように、

「横移動の微小変化量 $dx$ 」辺りの

『時間の微小変化量 $dt$ 』が求まりますね。

位置 $x$ で高さ $y$ は変わるので、

これは直観的に理解できるかと思います。

$\displaystyle dt=\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}\,dx$

でまあこう変形して「微小時間の和」を考えれば、

『 $x=0$ から $x=k$ 』までの範囲だと、

$\begin{array}{rlll} x(T)&=x \\ \\ x(c)&=k \end{array}$

$\begin{array}{rlc} \displaystyle T:&0&→&c \\ \\ \displaystyle x:&0&→&k \end{array}$

『何秒で到達するのか』を求めることができます。

$\displaystyle T(f(x))=\int_{0}^{k}\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}\,dx$

はい、とまあこんな感じに、

『最短経路 $f(x)$ 』を求める問題を考えた結果、

\begin{array}{rlc} f(0)&=0 \\ \\ f(a)&=b \end{array}

$\displaystyle T(f(x))=\int_{0}^{a}\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}\,dx$

こんなよく分かんない形をした、

到達時間の関数 $T(f(x))$ が求まりました。

ちなみに具体的な経路 $y=f(x)$ を決めると、

この式は↓みたいな感じになります。

$\displaystyle T(f(x))=\int_{0}^{a}\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}\,dx$

$\begin{array}{rlc} \displaystyle f(x)&=x \\ \\ f^{\prime}(x)&=1 \end{array}$

$\begin{array}{rlc} \displaystyle T(x)&\displaystyle =\int_{0}^{a}\frac{\sqrt{1+(1)^2 }}{\sqrt{2gx}}\,dx \\ \\ &\displaystyle =\int_{0}^{a}\frac{\sqrt{2}}{\sqrt{2gx}}\,dx \\ \\ &\displaystyle =\frac{1}{\sqrt{g}}\int_{0}^{a}\frac{1}{\sqrt{x}}\,dx \end{array}$

\begin{array}{rlc} \displaystyle f(x)&=x^2 \\ \\ f^{\prime}(x)&=2x \end{array}

$\begin{array}{rlc} \displaystyle T(x^2)&\displaystyle =\int_{0}^{a}\frac{\sqrt{1+(2x)^2 }}{\sqrt{2gx^2}}\,dx \\ \\ &\displaystyle =\frac{1}{\sqrt{2g}}\int_{0}^{a}\left( \sqrt{\frac{1}{x^2}}+\sqrt{\frac{(2x)^2 }{x^2}} \right)\,dx \end{array}$

経路を表す関数 $f(x)$ の中身はこんななので、

計算はこんな感じになっちゃいます。

最短経路と方向微分

最短経路についてですけど、

ここで、わりと特殊な操作を行います。

$\begin{array}{rlc} \displaystyle δT(f(x))&\displaystyle =\lim_{ε→0} T(f(x)+v(t+ε-t))-T(f(x)) \\ \\ df(x)&\displaystyle =\lim_{ε→0}(f(x)+v(t+ε-t))-f(x) \\ \\ \\ \displaystyle\frac{ δT(f(x))}{df(x)}&\displaystyle =\frac{ δT(f(x))}{dt} \\ \\ &\displaystyle =\lim_{ε→0}\frac{T(f(x)+vε)-T(f(x))}{(t+ε)-t} \end{array}$

というのも「多変数関数の微分」なので、

『ガトー微分』っていうのをとるんです。

ただまあガトー微分って言われても

字面じゃ意味が全く分かんないんで、

$\begin{array}{rlc} \displaystyle \frac{d}{dt}f(x(t),y(t))&=\displaystyle \lim_{ε→0}\frac{f(x,y)+(v_1ε,v_2ε))-f(x,y)}{(t+ε)-t} \\ \\ &=\displaystyle \lim_{ε→0}\frac{f(x+dx,y+dy)-f(x,y)}{(t+ε)-t} \end{array}$

「方向微分」って言っておきます。

基本はこっちだと思っておいてください。

まあ、名前はあんまり気にしないように。

操作自体は普通の微分とあんまり変わりません。

単に「直交系」の考え方を使って、

$x$ と $f(x)$ を同時に動かしてるだけです。

イメージとしては、

要は複素数のあれの感じで、

$\begin{array}{rlc} \displaystyle x&=r\cos ωt \\ \\ y&=r\sin ωt \end{array}$

『超短い時間での変化 $dt$ 』を使って、

『超小さい範囲の経路の変化 $dy$ 』を、

上下に動かして調整する感じになります。

まあつまり $v$ の役割は調整ですね。

『向きを決めてるベクトル $v$ 』です。

ちなみに文字は何でもOK。

と言ってもこれじゃよく分かんないと思います。

なにより「多変数関数」ですから、

計算がよく分かりませんし。

偏微分と全微分の意味

↑を説明するためには「偏微分」が必要なので、

ここでちゃんと説明しておきます。

$\begin{array}{rlll} \displaystyle df&\displaystyle =&\displaystyle\frac{\partial f}{\partial x}dx&\displaystyle +\frac{\partial f}{\partial y}dy \\ \\ \displaystyle \frac{d}{dt}f&\displaystyle =&\displaystyle\frac{\partial f}{\partial x}\frac{dx}{dt}&\displaystyle +\frac{\partial f}{\partial y}\frac{dy}{dt} \end{array}$

偏微分ってのは、ざっと説明すると、

『多変数関数の時に使う微分』のことです。

記号での表現については、

２変数関数 $z=f(x,y)$ を考えた時、

$\begin{array}{ccc} \displaystyle \frac{\partial}{\partial x}f(x,y),&\displaystyle\frac{\partial}{\partial x}f,&\displaystyle\frac{\partial f}{\partial x} \\ \\ \displaystyle \frac{\partial}{\partial y}f(x,y),&\displaystyle\frac{\partial}{\partial y}f,&\displaystyle\frac{\partial f}{\partial y} \end{array}$

こんな風に書かれることが多いですね。

見た目厳つくて抵抗あると思うんですけど、

基本は普通の微分と変わりません。

$f(x,y)=x^2+y^2$

$\begin{array}{rlc} \displaystyle \frac{\partial}{\partial x}f(x,y)&=(x^2)^{\prime}+(y^2)^{\prime} \\ \\ &=2x \\ \\ \\ \displaystyle \frac{\partial}{\partial y}f(x,y)&=(x^2)^{\prime}+(y^2)^{\prime} \\ \\ &=2y \end{array}$

具体的な感じだと、

「偏微分される」とこんな感じになります。

やってることは、

『関数と１つの変数だけ』に注目して、

『その他の点を固定（定数に）』して微分する、という感じ。

$\begin{array}{rlc} \displaystyle \frac{\partial f(x,y)}{\partial x}&\displaystyle =\lim_{h→0}\frac{f(x+h,y)-f(x,y)}{(x+h)-x} \\ \\ \displaystyle \frac{\partial f(x,y)}{\partial y}&\displaystyle =\lim_{h→0}\frac{f(x,y+h)-f(x,y)}{(y+h)-y} \end{array}$

まあつまり、やってることも意味も、

１変数の微分とほぼ同じ、です。

ただ、全微分ってのを考えた時、

ちょっとこれだと問題があるんですよ。

というのも、

偏微分は『平面に限定する』ことで

『接線の傾き』を求めてるわけなんですが、

全微分をすると、

『すべての変数を動かす』ことになるので、

$2$ 変数なら『接平面の傾き』を求めることになります。

どういうことかというと、

このままだと、よく分かんないんですよ。

$\begin{array}{rlc} \displaystyle dz&=df(x,y) \\ \\ &=f(x+dx,y+dy)-f(x,y) \end{array}$

何を求めたいのかはわかってます。

でも、具体的な計算ってどうすればいいんでしょう？

結論としては、

『座標』から「図形的に」式を求めます。

どういうことかというと、

それぞれの『座標』を考えるんですよ。

$\begin{array}{llc} x,y+dy&x+dx,y+dy \\ \\ x,y&x+dx,y \end{array}$

初期位置を原点 $(0,0)$ と考えて

シンプルにしてみましょうか。

$\begin{array}{llc} 0,dy&dx,dy \\ \\ 0,0&dx,0 \end{array}$

$x$ で決まる空間上の点 $z$ の座標と

$y$ で決まる空間上の点 $z$ の座標

これを別々に考えてみると、

$\begin{array}{rllll} \displaystyle f(x,y)&=x+y \\ \\ \\ f(0,0)&=0+0 \\ \\ \\ &f(0+1,0)&=1+0 \\ \\ &f(0,0+1)&=0+1 \\ \\ \\ &&f(0+1,0+1)&=1+1 \end{array}$

具体的にはこんな感じになりますよね。

んでこれを一般化すると、

$\begin{array}{rlc} f(x+dx,y)&=f(x,y)+df(x+dx,y) \\ \\ f(x,y+dy)&=f(x,y)+df(x,y+dy) \\ \\ \\ \\ z+dz&=f(x,y)+df(x+dx,y+dy) \\ \\ &=f(x+dx,y+dy) \\ \\ \\ &= \displaystyle f(x,y)+df(x+dx,y)+df(x,y+dy) \\ \\ &=f(x,y)+ \displaystyle \frac{\partial }{\partial x}f(x,y)\,dx+\frac{\partial }{\partial y}f(x,y) \,dy\end{array}$

こんな感じになって、

こうすると $dz$ が具体的に求まるじゃないですか。

$\begin{array}{rlc} dz&=\displaystyle df(x+dx,y+dy) \\ \\ &=\displaystyle \frac{\partial }{\partial x}f(x,y)\,dx+\frac{\partial }{\partial y}f(x,y) \,dy \end{array}$

まあ要は、こういう話です。

ただの座標の足し算。

順番にまとめると、

座標 $z+dz$ を求める手順を考えて、

まず『 $x$ の変化による $z=f(x,y)$ の変化』を、

$x,z$ 平面だけ見て↓を導きます。

$\begin{array}{llc} \displaystyle f(x+dx,y)&\displaystyle =f(x,y)+\frac{\partial f(x,y)}{\partial x}dx \\ \\ \displaystyle f(x+dx,y)-f(x,y) &\displaystyle =\frac{\partial z}{\partial x}dx \end{array}$

偏微分の部分については

↓みたいに考えると納得できるかと。

$\begin{array}{rlc} \displaystyle \partial x&\displaystyle =\lim_{h→0}(x+h)-x \\ \\ dx&\displaystyle =\lim_{h→0}(x+h)-x \\ \\ \\ \displaystyle \frac{\partial z}{\partial x} &\displaystyle =\lim_{h→0}\frac{f(x+h,y)-f(x,y)}{(x+h)-x} \\ \\ &\displaystyle =\frac{f(x+dx,y)-f(x,y)}{dx} \end{array}$

んで同じように $y,z$ 平面で見れば、

$\displaystyle f(x,y+dy)-f(x,y) =\frac{\partial z}{\partial y}dy$

これが導けるので、

後は $x,y$ の両方を動かした $z$ の微小変化 $dz$ を、

図形的に、座標を足し合わせて求めます。

$\begin{array}{rlc} \displaystyle f(x+dx,y)-f(x,y) &\displaystyle =df(x+dx,y) \\ \\ &\displaystyle =\frac{\partial f(x,y)}{\partial x}dx \\ \\ \displaystyle f(x,y+dy)-f(x,y)&\displaystyle =df(x,y+dy) \\ \\&\displaystyle =\frac{\partial f(x,y)}{\partial y}dy \end{array}$

$\begin{array}{rlc}z+dz&=\displaystyle f(x+dx,y+dy) \\ \\ &=f(x,y)+df(x+dx,y)+df(x,y+dy) \\ \\ \\ &\displaystyle =f(x,y)+\frac{\partial f(x,y)}{\partial x}dx+\frac{\partial f(x,y)}{\partial y}dy \end{array}$

$\begin{array}{rlc}\displaystyle dz&=f(x+dx,y+dy)-f(x,y) \\ \\ &\displaystyle =\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy \end{array}$

んでこれを、極座標の感覚を使って、

$x,y$ の両方が $t$ で変化するようにすれば、

全微分は、↓みたいに書くことができます。

$\begin{array}{rlll} \displaystyle x&=x(t)&&(=\cos t,r \cos t ,...) \\ \\ \displaystyle y&=y(t)&&(=\sin t,r\sin t ,...) \end{array}$

$\displaystyle \frac{dz}{dt}=\frac{\partial z}{\partial x}\frac{dx}{dt}+\frac{\partial z}{\partial y}\frac{dy}{dt}$

これが、全微分と偏微分の意味です。

セットで覚えるのがベスト。

全微分と方向微分

↑で出てきた「全微分」を、

『ベクトル $v$ を使って』一般化したら、

$\begin{array}{rlc} \displaystyle \frac{d}{dt}f(x,y)&\displaystyle =\frac{\partial f(x,y)}{\partial x}\frac{dx}{dt}+\frac{\partial f(x,y)}{\partial y}\frac{dy}{dt} \\ \\ &\displaystyle = \frac{f(x+dx,y+dy)-f(x,y)}{dt} \\ \\ \\ &\displaystyle =\lim_{ε→0} \frac{f(x+dx,y+dy)-f(x,y)}{(t+ε)-t} \\ \\ &\displaystyle =\lim_{ε→0} \frac{f((x,y)+(dx,dy))-f(x,y)}{(t+ε)-t} \\ \\ \\ &\displaystyle =\lim_{ε→0} \frac{f((x,y)+εv)-f(x,y)}{(t+ε)-t} \end{array}$

「方向微分」が得られます。

これはまあ、こんだけ。

ちなみにこれをさらに一般化したのがガトー微分です。

これは特に気にしなくてOK。

重要なのは「ベクトルで多変数を表現する感覚」と、

複数の座標を時間の関数とする「極座標の感覚」で、

↑の式は、その結果として得られるものになります。

ラグランジアン

|| 基本の変数で作れる関数を一般化

これは『一般化された象徴的な関数』の中でも、

特に「座標・座標の微分」で書かれてるやつのこと。

具体的には、例えば「エネルギー」とかだと

$\begin{array}{lllll} \displaystyle E&\displaystyle =\frac{1}{2}mv^2+V(q) \\ \\ &\displaystyle =\frac{1}{2}m(v_{x}^{2}+v_{y}^{2})+V(x,y) \\ \\ \\ &\displaystyle =\frac{1}{2}m\left(\frac{dl}{dt}\right)^2+V(q) &&l=\sqrt{dx^2+dy^2} \end{array}$

このように書けるじゃないですか。

他にも「到達時間」を求める時に出てくる

『長さについての関数』を考える時、

$\begin{array}{rlc} \displaystyle dl&=\sqrt{dx^2+dy^2} \\ \\ &\displaystyle =dx\sqrt{1+\left( \frac{dy}{dx} \right)^2} \end{array}$

$\begin{array}{rlc} \displaystyle v&\displaystyle =\frac{dl}{dt} \\ \\ &\displaystyle =\frac{dx}{dt}\sqrt{1+\left(\displaystyle\frac{dy}{dx}\right)^2} \\ \\ \\ v\,dt&=dx\sqrt{1+(y^{\prime})^2} \\ \\ dt&\displaystyle =\frac{\sqrt{1+(y^{\prime})^2}}{v}\,dx \end{array}$

$\begin{array}{rlc} \displaystyle dt&\displaystyle =\frac{dl}{v} \\ \\ &\displaystyle=\frac{\sqrt{1+(y^{\prime})^2+(z^{\prime})^2+\cdots}}{v}\,dx \end{array}$

こういうのが出てきて、

その時の「変数のパターン」ってあるじゃないですか。

つまりはまあそんな感じで、

特に「位置とその微分」を変数に持つ関数は、

全部ラグランジアンって呼ぶことにしてるんですよ。

$\begin{array}{rlc} I&=\displaystyle \int_{}^{} L\left(q,\frac{d}{d t}q,t\right) \,dt \\ \\ &\displaystyle =\int_{}^{} L(q(t),\dot{q}(t),t) \,dt \\ \\ &\displaystyle =\int_{}^{} L(q(t),q^{\prime}(t),t) \,dt \\ \\ &\displaystyle =\int_{}^{} L(q,q^{\prime},t) \,dt \\ \\ &\displaystyle =\int_{}^{} L \,dt \end{array}$

この $L(q,q^{\prime})$ がラグランジアンです。

$q(t)$ が一般化座標 $(x,y,z,...)$ を表してて、

$q^{\prime}(t)$ は基本的に速度を表してます。

見た目難しいですけど、要は「 $f(x)$ 」と同じです。

これ自体に特に意味はありません。

単に書くのが面倒だから省略してるだけ。

これが意味を持つようになるのは

これを『使うとき』でして、

$\begin{array}{rlc} \displaystyle I&=\displaystyle \int_{}^{} L\left(q,q^{\prime}\right) \,dt \end{array}$

具体的には↑のような関数（汎関数）をとると、

↓みたいなけっこう便利な方程式が導けたりします。

$\begin{array}{rlc} \displaystyle \frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}&=0 \end{array}$

これはラグランジュの運動方程式って呼ばれてて、

「変分原理」とセットで導かれるものになりますね。

まとめると、ラグランジアンっていうのは、

『変数が座標と速度に限定された単なる関数』のことで、

主に変分原理の主張を表すときに使われます。

ラグランジュの運動方程式

これは「変分原理」から導かれるもので、

簡単に言うと『計算を簡単にするためのもの』です。

$\begin{array}{lll} \displaystyle \frac{\partial L}{\partial q}&\displaystyle -\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}&=0 \\ \\ \displaystyle \frac{\partial L}{\partial q}&\displaystyle-\frac{d}{dt}\frac{\partial L}{\partial \dot{q}}&=0 \\ \\ \displaystyle \frac{\partial}{\partial q}L(q(t),\dot{q}(t))&\displaystyle-\frac{d}{dt}\frac{\partial}{\partial \dot{q}}L(q(t),\dot{q}(t))&=0 \end{array}$

$\displaystyle \frac{\partial L}{\partial q}=\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}$

見た目はちょっと厳つく見えますけど、

式自体はかなり単純。

$\displaystyle\frac{\partial L}{\partial q}$

これを計算して、

$\displaystyle\frac{\partial L}{\partial q^{\prime}}$

これを計算して、

$\displaystyle\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}$

これを計算するだけ。

この方程式を使うと、

問題の計算がすごく単純になることが分かると思います。

ラグランジュ方程式の導出

これの導出のやり方なんですけど、

基本は変分法の感覚に近いです。

$\displaystyle I(q(t))=\int_{t_1}^{t_2}L(q,\dot{q})\,dt$

というのも、これを求めるために、

こういうやつを使うんですよ。

これ何？って話だと思うんですけど、

結論としては、「作用」って呼ばれてるものでして、

「単体で見ると、特に意味の無いもの」ですね。

具体的にすると意味が出てきて、

例えば『到達時間の関数』って意味を持つことがあったり。

$\begin{array}{rlc} \displaystyle T&\displaystyle =\int dt \\ \\ \displaystyle dt&\displaystyle =\frac{dl}{v} \end{array}$

まあつまり「作用」ってのは、

こういう「関数 $T$ のようなもの」を考える時の、

$I^{\prime}=0$

『最小値などを求めるために必要な手順の１つ』

みたいな感覚のものになります。

と言ってもよく分かんないと思うので、

とりあえずこれを使って考えてみましょうか。

$\begin{array}{rlc} \displaystyle dI(q)&=I(q+dq)-I(q) \\ \\ &\displaystyle =\int_{t_1}^{t_2}L(q+dq,\dot{q}+d\dot{q})\,dt-\int_{t_1}^{t_2}L(q,\dot{q})\,dt \\ \\ &\displaystyle =\int_{t_1}^{t_2}\Bigl( L(q+dq,\dot{q}+d\dot{q})-L(q,\dot{q}) \Bigr) \,dt \end{array}$

まあ見ての通り、この状態だと何もできません。

ただ、↓の関係を思い出してみてください。

$\begin{array}{llc} \displaystyle L(q+dq,q^{\prime}+dq^{\prime}) \\ \\ \displaystyle =L(q,q^{\prime})+\frac{\partial L(q,q^{\prime})}{\partial q}dq +\frac{\partial L(q,q^{\prime})}{\partial q^{\prime}}dq^{\prime} \end{array}$

偏微分の座標の足し算を考えると、

$L(q+dq,q^{\prime}+dq^{\prime})$ を書き換えることができます。

てなわけでそのまま式変形。

$\begin{array}{rlc} \displaystyle \left( L(q,\dot{q})+\frac{\partial L(q,q^{\prime})}{\partial q}dq +\frac{\partial L(q,q^{\prime})}{\partial q^{\prime}}dq^{\prime} \right)-L(q,\dot{q}) \\ \\ \displaystyle =\frac{\partial L(q,q^{\prime})}{\partial q}dq +\frac{\partial L(q,q^{\prime})}{\partial q^{\prime}}dq^{\prime} \end{array}$

$\begin{array}{llc} \displaystyle \int_{t_1}^{t_2}\Bigl( L(q+dq,\dot{q}+d\dot{q})-L(q,\dot{q}) \Bigr) \,dt \\ \\ \displaystyle =\int_{t_1}^{t_2}\left( \frac{\partial L(q,q^{\prime})}{\partial q}dq +\frac{\partial L(q,q^{\prime})}{\partial q^{\prime}}dq^{\prime} \right) \,dt \\ \\ \\ \displaystyle =\int_{t_1}^{t_2}\left( \frac{\partial L}{\partial q}dq +\frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt \end{array}$

するとまあ、こうなりますよね。

$L$ は $L(q,q^{\prime})$ の表現を省略してるだけ。

ただまあこれ、いくらかはスッキリしましたが、

この時点でもまだよく分かんなくないですか？

$\begin{array}{rlc} \displaystyle dq \\ \\ dq^{\prime}&\displaystyle =\frac{dq}{dt} \end{array}$

なので、とりあえずここを揃えてみます。

整理できる部分はここくらいですし。

$\begin{array}{clc} \displaystyle \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \\ \\ \displaystyle \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt \end{array}$

てなわけで、これを変形してみましょうか。

とっかかりが特に無いので、部分積分を使ってみます。

$\begin{array}{rlc} \displaystyle \Bigl( f(x)g(x) \Bigr)^{\prime}&=f^{\prime}(x)g(x)+f(x)g^{\prime}(x) \\ \\ \\ \displaystyle \int_{a}^{b} \Bigl( f(x)g(x) \Bigr)^{\prime} \, dx&\displaystyle =\int_{a}^{b} f^{\prime}(x)g(x)\,dx+\int_{a}^{b} f(x)g^{\prime}(x)\,dx \\ \\ \displaystyle \Bigl[ f(x)g(x) \Bigr]_{a}^{b}&\displaystyle =\int_{a}^{b} f^{\prime}(x)g(x)\,dx+\int_{a}^{b} f(x)g^{\prime}(x)\,dx \end{array}$

これをそのまま使えば、

$\displaystyle \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt$

$\displaystyle \left[ \frac{\partial L}{\partial q^{\prime}}dq \right]_{t_1}^{t_2}=\int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt+\int_{t_1}^{t_2} \left( \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}dq \right) \,dt$

定数 $c$ として考えると、

←のやつを消せますから、

$\begin{array}{rlc} \displaystyle\left[ \frac{\partial L}{\partial q^{\prime}} \right]_{t_1}^{t_2}&=c \\ \\ \\ \displaystyle \left[ \frac{\partial L}{\partial q^{\prime}}dq \right]_{t_1}^{t_2}&\displaystyle=\left[ \frac{\partial L}{\partial q^{\prime}} \right]_{t_1}^{t_2}\left[dq\right]_{t_1}^{t_2} \\ \\ &\displaystyle =c\left[\lim_{h→0} (q+h)-q\right]_{t_1}^{t_2} \\ \\ &=0 \end{array}$

結果的に、↓の等式が導けます。

$\begin{array}{rll} \displaystyle \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt&\displaystyle +\int_{t_1}^{t_2} \left( \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}dq \right) \,dt&=0 \\ \\ \displaystyle \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt&\displaystyle =-\int_{t_1}^{t_2} \left( \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}dq \right) \,dt \end{array}$

後はこれを元の式に入れれば、

$\begin{array}{llc} \displaystyle \int_{t_1}^{t_2}\left( \frac{\partial L}{\partial q}dq +\frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt \\ \\ \displaystyle =\int_{t_1}^{t_2} \frac{\partial L}{\partial q}dq \,dt +\int_{t_1}^{t_2}\frac{\partial L}{\partial q^{\prime}}dq^{\prime} \,dt \\ \\ \\ \displaystyle =\int_{t_1}^{t_2} \frac{\partial L}{\partial q}dq \,dt -\int_{t_1}^{t_2} \left( \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}dq \right) \,dt \\ \\ \displaystyle =\int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q} - \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}} \right) \,dq \,dt \end{array}$

このようになって、

最後、上の式と『変分原理』の主張を考えると、

$\begin{array}{rlc} \displaystyle dI(q)&\displaystyle =\int_{t_1}^{t_2} \left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\right)\,dq \,dt \\ \\ \displaystyle \frac{dI(q)}{dt}&\displaystyle =\frac{d}{dt}\int_{t_1}^{t_2} \left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\right)\,dq \,dt \\ \\ &=0 \end{array}$

$\begin{array}{rlc} \displaystyle \frac{dI(q)}{dt}&\displaystyle =\left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\right)\,dq \\ \\ &=0 \end{array}$

このようになるので、

あとは自然に式変形していけば、

結果的に↓が導かれます。

$\begin{array}{rlc} \displaystyle \left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\right)\,dq &=0 \\ \\ \displaystyle \frac{\partial L}{\partial q}\,dq&\displaystyle =\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\,dq \\ \\ \displaystyle \frac{\partial L}{\partial q}&\displaystyle =\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\end{array}$

後はこれを好きなように書く感じですね。

一番見るのは↓ですけど。

$\begin{array}{rlc} \displaystyle \frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}&=0 \end{array}$

まあともかくこう見ると、

なんか、けっこうすっきりしましたよね。

はい、まあそんな感じで、

なんかスッキリしたこの式を、

「ラグランジュの運動方程式」

という風に呼ぶことにしたんですよ。

最短経路とラグランジュ方程式

保留していた「最短経路」の問題について、

↑の運動方程式を使って解説していきます。

$\begin{array}{rlc} \displaystyle T&\displaystyle =\int dt \\ \\ &\displaystyle =\int \frac{1}{v}\,dl \end{array}$

というか、基本的に↑のを使わないと解けません。

いや、まあ解けはするんですけど、

結局似たような手順を踏むことになります。

ともかく話を進めていくと、

こいつは↓みたいに考えて解く感じです。

$\begin{array}{rlc} \displaystyle T&\displaystyle =\int \frac{\sqrt{1+(y^{\prime})^2}}{\sqrt{2gy}} dx \\ \\ &\displaystyle =\int L(y,y^{\prime}) \,dx \end{array}$

$L$ をラグランジュ方程式に入れれば、

$\begin{array}{rlc} \displaystyle \frac{\partial }{\partial q}L(y,y^{\prime}) -\frac{d}{dt}\frac{\partial }{\partial q^{\prime}}L(y,y^{\prime})&=0 \\ \\ \end{array}$

$\begin{array}{rlc} L(y,y^{\prime})&\displaystyle =\sqrt{\frac{1+(y^{\prime})^2}{2gy}} \end{array}$

まあ普通にこうなって、後は解くだけですよね。

でまあ、これを解いてもいいんですけど、

実はこれ、だいぶ計算が複雑です。

$\begin{array}{rll} \displaystyle \frac{1}{2gc^2}&=2r \\ \\ &=\mathrm{const.} \end{array}$

$\begin{array}{rlc} \displaystyle y^{\prime}&\displaystyle =\sqrt{\frac{2r-y}{y}} \\ \\ &\displaystyle =\sqrt{\frac{r(1+\cos θ )}{r(1-\cos θ )}} \end{array}$

$\displaystyle \left\{\begin{array}{rlc} \displaystyle x&=r(θ-\sin θ) \\ \\ y&=r(1-\cos θ) \end{array}\right.$

答えはまあこれなんですけど、

$\begin{array}{rlc} \displaystyle \frac{\partial }{\partial q}L(y,y^{\prime}) -\frac{d}{dt}\frac{\partial }{\partial q^{\prime}}L(y,y^{\prime})&=0 \\ \\ \end{array}$

これ、↑のままだと計算が超面倒。

なので計算をする前の段階で、

ある操作を行っておきます。

$L(q,q^{\prime})=L(y,y^{\prime})$

何の話かと言うと、

$L$ には含まれてない変数 $x$ があるので、

この式をちょっと簡単にできそう、みたいな話です。

ベルトラミの公式

ラグランジュの運動方程式は簡単にできます。

このパターンは位置 $q$ が一方向（ $x$ 無し）の話ですね。

$\begin{array}{rlc} \displaystyle \frac{d}{dx}\left(L(y,y^{\prime})-y^{\prime}\frac{\partial }{\partial y^{\prime}}L(y,y^{\prime}) \right) &=0 \\ \\ \displaystyle L(y,y^{\prime})-y^{\prime}\frac{\partial }{\partial y^{\prime}}L(y,y^{\prime})&=\mathrm{const.} \end{array}$

この場合、 $\mathrm{const.}$ をなんらかの定数と考えて、

方程式をこのような形に変形できます。

まあ、とりあえずこれを導いてみましょうか。

これの何が嬉しいかは後で解説。

$\begin{array}{rlc} \displaystyle dL&\displaystyle =\frac{\partial L(y,y^{\prime})}{\partial y}dy+\frac{\partial L(y,y^{\prime})}{\partial y^{\prime}}dy^{\prime} \\ \\ 0&=\displaystyle \frac{\partial }{\partial q}L(y,y^{\prime}) -\frac{d}{dt}\frac{\partial }{\partial q^{\prime}}L(y,y^{\prime}) \end{array}$

まず発想なんですけど、

これは「全微分」と「ラグランジュ方程式」から

連立方程式を作ってみよう、って感じでして、

$\begin{array}{rlc} \displaystyle dL&\displaystyle =\frac{\partial L}{\partial y}dy+\frac{\partial L}{\partial y^{\prime}}dy^{\prime} \\ \\ 0&=\displaystyle \frac{\partial L}{\partial y} -\frac{d}{dx}\frac{\partial L}{\partial y^{\prime}} \end{array}$

試しに、これのどこかを合わせてみたら、

なんか簡単になった、みたいな。そんな感じです。

というわけで早速求めていきましょうか。

そのために、まずは全微分の確認からしていきます。

$\begin{array}{rlc} \displaystyle \frac{d}{dx}L&\displaystyle =\frac{\partial L}{\partial y}\frac{dy}{dx}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \\ \\ &\displaystyle =\frac{\partial L}{\partial y}y^{\prime}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \end{array}$

んで次、合いそうな箇所があるので、

微分を考慮しつつ→側に $y^{\prime}$ を入れてみます。

$\begin{array}{rlc} 0&=\displaystyle \frac{\partial L}{\partial y}y^{\prime} -\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime} \end{array}$

整理すると↓みたいに。

$\begin{array}{rlc} \displaystyle \displaystyle \frac{d}{dx}L&\displaystyle =\textcolor{pink}{\frac{\partial L}{\partial y}y^{\prime}}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \\ \\ 0&=\displaystyle \textcolor{pink}{\frac{\partial L}{\partial y}y^{\prime}} -\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime} \end{array}$

で、後は ↑の式 $-$ ↓の式をして、

共通するやつを消せば↓が。

ただこれだと、→のやつがよく分かりません。

どうにか単純な形になるように変形したいです。

ということで式をよく見てみると、

$\begin{array}{rlc} \displaystyle \left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime}&\displaystyle +\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \\ \\ \\ f^{\prime}(x)g(x)&+f(x)g^{\prime}(x) \\ \\ \displaystyle \left( \frac{d}{dx}f(x) \right) g(x)&\displaystyle +f(x)\frac{d}{dx}g(x) \end{array}$

この形になってることが分かります。

$\begin{array}{rlc} \displaystyle \frac{d}{dx}(f(x)g(x))&\displaystyle =\left( \frac{d}{dx}f(x) \right) g(x)+f(x)\frac{d}{dx}g(x) \\ \\ \\ \displaystyle \frac{d}{dx} \left( \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right) &\displaystyle =\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime}+\left( \frac{\partial L}{\partial y^{\prime}}\right)\frac{d}{dx}y^{\prime} \end{array}$

つまり微分の定義を考えると、

→のやつをこのように一つにできそう。

はい、とまあここまでくれば後は簡単で、

↓のようにすれば、

$\begin{array}{rlc} \displaystyle \frac{d}{dx}L&\displaystyle =\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \\ \\ &\displaystyle =\frac{d}{dx} \left( \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right) \end{array}$

$\begin{array}{rlc} \displaystyle \frac{d}{dx}L - \frac{d}{dx} \left( \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right)&\displaystyle =0 \\ \\ \displaystyle \frac{d}{dx} \left( L - \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right)&\displaystyle =0 \end{array}$

微分の位置に気を付けていけば、

このように変形してシンプルにできます。

$\begin{array}{rlc} \displaystyle \frac{d}{dx} \left( L - \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right)&\displaystyle =0 \\ \\ \displaystyle \frac{d}{dx} \left( L - y^{\prime} \frac{\partial L}{\partial y^{\prime}} \right)&\displaystyle =0 \end{array}$

で最後、微分して $0$ になる条件から、

$\begin{array}{rlc} \displaystyle \frac{d}{dx} \left( L - y^{\prime} \frac{\partial L}{\partial y^{\prime}} \right)&\displaystyle =0 \\ \\ \\ \displaystyle L - y^{\prime} \frac{\partial L}{\partial y^{\prime}}&=\mathrm{const.} \end{array}$

この微分される部分が、

「なんらかの定数 $\mathrm{const.}$ 」になることが分かります。

$\begin{array}{rlc} \displaystyle L - y^{\prime} \frac{\partial L}{\partial y^{\prime}}&=\mathrm{const.} \end{array}$

これがベルトラミの公式ですね。

主に最速降下曲線の計算で使われます。

最速降下曲線とベルトラミの公式

ここまでくると計算はすごく単純化されてて、

$\begin{array}{rlc} \displaystyle L(y,y^{\prime})&\displaystyle =\sqrt{\frac{1+(y^{\prime})^2}{2gy}} \\ \\ \displaystyle \frac{\partial }{\partial y^{\prime}}L&\displaystyle =\frac{\partial }{\partial y^{\prime}}\sqrt{\frac{1+(y^{\prime})^2}{2gy}} \\ \\ &\displaystyle =\sqrt{\frac{1}{2gy}} \frac{\partial }{\partial y^{\prime}}\sqrt{1+(y^{\prime})^2} \end{array}$

これを計算すれば、

$\begin{array}{rlc} \displaystyle\frac{d}{dx}\sqrt{x}&= \displaystyle \lim_{h→0}\frac{\sqrt{x+h}-\sqrt{x}}{(x+h)-x} \\ \\ &\displaystyle =\lim_{h→0}\frac{\sqrt{x+h}-\sqrt{x}}{h} \left( \frac{\sqrt{x+h}+\sqrt{x}}{\sqrt{x+h}+\sqrt{x}} \right) \\ \\ \\ &\displaystyle =\lim_{h→0}\frac{h}{h(\sqrt{x+h}+\sqrt{x})} \\ \\ &\displaystyle =\lim_{h→0}\frac{1}{\sqrt{x+h}+\sqrt{x}} \\ \\ &\displaystyle =\frac{1}{2\sqrt{x}} \end{array}$

$\begin{array}{rlc} g(x)&=u \\ \\\displaystyle \frac{df(g(x))}{dx}& =\displaystyle \frac{df(u)}{du}\frac{du}{dx} \\ \\ &\displaystyle =\lim_{k→0}\frac{f(u+k)-f(u)}{(u+k)-u} \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x}\end{array}$

$\begin{array}{rlc} \displaystyle \frac{\partial }{\partial y^{\prime}}\sqrt{1+(y^{\prime})^2}&\displaystyle =\frac{1}{2} \left( \sqrt{1+(y^{\prime})^2} \right)^{-\frac{1}{2}} \left(1+(y^{\prime})^2 \right)^{\prime} \\ \\ &\displaystyle =\frac{1}{2}\frac{1}{\sqrt{1+(y^{\prime})^2}}2y^{\prime} \\ \\ &\displaystyle =\frac{y^{\prime}}{\sqrt{1+(y^{\prime})^2}}\end{array}$

後は定数 $c,r$ を適当に入れれば↓で終わりです。

$\begin{array}{rlc} \displaystyle L - y^{\prime} \frac{\partial L}{\partial y^{\prime}}&=c \\ \\ \displaystyle \sqrt{\frac{1+(y^{\prime})^2}{2gy}} - y^{\prime}\frac{1}{\sqrt{2gy}}\frac{y^{\prime}}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c \\ \\ \\ \displaystyle \sqrt{1+(y^{\prime})^2} - \frac{(y^{\prime})^2}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \\ \\ \displaystyle \sqrt{1+(y^{\prime})^2}\frac{\sqrt{1+(y^{\prime})^2}}{\sqrt{1+(y^{\prime})^2}} - \frac{(y^{\prime})^2}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \\ \\ \\ \displaystyle \frac{1+(y^{\prime})^2}{\sqrt{1+(y^{\prime})^2}} - \frac{(y^{\prime})^2}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \\ \\ \displaystyle\frac{1}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \end{array}$

ここまで変形できれば後一息ですね。

$\begin{array}{rll} \displaystyle\frac{1}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \\ \\ \displaystyle\frac{1}{1+(y^{\prime})^2}&\displaystyle =c^2 2gy \\ \\ \\ \displaystyle \frac{1}{2gc^2}\frac{1}{y}&\displaystyle =1+(y^{\prime})^2 \\ \\ \displaystyle r\frac{1}{y}-1&\displaystyle =(y^{\prime})^2 \end{array}$

はい。これで答えが出ました。

あっさりし過ぎてますが、これで終わりです。

$\begin{array}{rlc} \displaystyle y^{\prime} &\displaystyle =\sqrt{\frac{r-y}{y}} \end{array}$

まあつまり、

重力下における最短経路を表す式は↑になります。

これはサイクロイドの式になるんですけど、

$\left\{ \begin{array}{rlc} \displaystyle x &=a(θ-\sin θ) \\ \\ y& =a(1-\cos θ) \end{array} \right.$

それはまた別でやります。

本題から逸れ過ぎるので。

>>続き

目次

変分原理／最小作用の原理

微分の意味

極限の感覚

微小変化量 dx,dy の感覚

微小変化量と微分

変分法

最速降下曲線の導出

速度

到達時間についての関数

最短経路と方向微分

偏微分と全微分の意味

全微分と方向微分

ラグランジアン

ラグランジュの運動方程式

ラグランジュ方程式の導出

最短経路とラグランジュ方程式

ベルトラミの公式

最速降下曲線とベルトラミの公式

微小変化量 $dx,dy$ の感覚