最小作用の原理/変分原理

 

|| 隙間を埋めるためのもの

これの役割は「2点間の物質の移動経路の予測」です。

量子力学では波動関数を定める根拠になってます。

スポンサーリンク

 

 

 


目次

 

量子の話 <<最初

ヒルベルト空間 <<計算のあれ

 

エルミート演算子 <<実数

物理量演算子の行列表示 <<前の

 

 

最小作用の原理「実際に起こる現象は最短のやつだけ」

 

   微分「傾き・変化量を求めるやつ」

   変分法「複雑な関数の最小・最大を求める方法」

   偏微分「多変数関数での微分」

 

   ラグランジアン「位置・速度を変数に持つ関数」

   ラグランジュの運動方程式「変分法の便利な公式」

   ベルトラミの公式「↑のより具体的な形」

 

 

 

 

 


変分原理/最小作用の原理

 

|| 実現される運動は、限られている

簡単に言うと『状態の変化は最短で行われる』っていう、

物理における基本原理の1つの話です。

 

 

もうちょっと砕けた感じで言うなら、

「最短以外の移動は起きないとする保証」って感じ。

 

 

具体的には「光」とか見ると分かり易くて、

こいつは『真っすぐにしか進まない』じゃないですか。

要はまあ、そういう話です。

 

 

 

て言っても、なんでその保証がいるの?と、

そう感じる人もいると思います。

 

 

少なくとも私はそう思ったんですけど、

よくよく考えてみると、なんか分かる気がしませんか?

 

 

というのも、

例えば「エネルギーの状態が確定」していて、

その「エネルギーの状態が変わった後も確定」している時、

 

 

その『中間での物質の位置/動き』の、

『変化の仕方/パターン』ってのは、

「無数に考えられる」じゃないですか。

 

 

あくまで「考えられるだけ」ですけど、

人間が観測するのは基本的に「点」になるので、

『見えてない中間』はよく分かりません。

 

 

実はぐにゃぐにゃに曲がってからその状態に行き着いてたり、

他にも1度別のものになって、元の状態に戻ってたり、

いろいろ想像はできるじゃないですか。

 

 

 

でも、例えばものを落とすと、

特に力を受けないなら、直線的に落ちますよね?

 

 

移動経路はぐしゃぐしゃになってないし、

すごく細かく2点をとって見ても、

ほぼ直線の移動しかしていないはずです。

 

 

他にも、例えば多少の勾配がある斜面にしても、

ものを転がせば、基本的に「地面に沿った状態」で、

『最短経路を通って』下っていきます。

 

 

その経路の全体を見ても、

いきなり逆走してる部分があったり、

突然真上に飛んでったりしてる部分はありません。

 

 

 

そう、このような「見えない中間」である

落下軌道、移動経路には、

ちゃんと規則性があるんですよ。

 

 

 

でまあ、それは明らかな事実ですから、

変分原理っていう名前が付いてるんですね。

 

 

まとめると、単なる事実として、

「無秩序にものは移動しない」し、

「限られた経路を通る」ことは実験から明らか。

 

 

だから、それを原理として保証する。

 

 

言ってしまえば、これはそれだけの話になります。

まあ、数学的な定義はややこしいんですが。

 

 

 

これの数学的な説明には

『微分の意味』と『変分法』の知識が必要なので、

先にそれから説明して、その後に詳しく説明していきます。

 

 

 

 

 

微分の意味

 

微分って聞くと難しく聞こえるかもしれませんが、

これはただの『変化量を求める操作』です。

 

\begin{array}{rlc} \displaystyle f^{\prime}(x)&=\displaystyle \frac{dy}{dx} \\ \\ &=\displaystyle \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x} \end{array}

 

意外と簡単なんですよ、これ。

 

 

「傾き・比例定数」とかを求める時に使うんですけど、

基本は『直線』だけ考えていればよくて、

複雑に考える必要はありません。

 

\begin{array}{rlc} \displaystyle y&=f(x) \\ \\ &=ax+b \end{array}

 

\begin{array}{rlc} \displaystyle \frac{f(x_2)-f(x_1)}{x_2-x_1} &= \displaystyle \frac{(ax_2+b)-(ax_1+b)}{x_2-x_1} \\ \\ &=\displaystyle \frac{a(x_2-x_1)}{x_2-x_1} \\ \\&=a \end{array}

 

というのも、やってることはこれだけなんですよ。

 

\begin{array}{rlc} \displaystyle f^{\prime}(x)&=\displaystyle \frac{dy}{dx} \\ \\ &=\displaystyle \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x} \end{array}

 

dx,dy の記号の意味がよく分かんないだけで、

操作自体はすごく単純なんです。

 

 

加えて、基本的に x,y2 次元だけ考えてればよくて、

それ以上の次元を考える必要はありません。

 

\displaystyle \frac{f(x_2)-f(x_1)}{x_2-x_1}

 

ただただ、↑の操作をしてるだけ。

余計なものはこの範囲を広げてるだけで、

それ以上の意味は特にありません。

 

 

 

まあとりあえず、

説明のために記号を定めておきましょうか。

 

\begin{array}{rlc} \displaystyle x&=x \\ \\ y&=f(x) \end{array}

 

これを基にして、まずは微分でいきなり出てくる

「ちょっとの変化量 dx,dy

この記号の意味について説明していきます。

 

 

 

 

 

極限の感覚

 

dx,dy を説明するために、

微分の根幹を成す操作である

『極限』について、ざっと説明しておきます。

 

\displaystyle \lim_{h→a} h = a

 

名前も見た目も厳ついですけど、

これも実はそんなに難しいものではありません。

 

 

というのも、

これはただ『近づけてる』だけなんですよ。

 

 

「代入」と混同されがちなんですけど、

これは「変数に値を入れる操作」ではなく、

『変数の値を変化させていく操作』なので、

 

 

『近づける』って感覚を意識してみると、

根本的に異なることが分かると思います。

 

\displaystyle \lim_{h→a} h = a

 

意味で考えるともっと分かりやすくて、これは

『→の値 a になる、というわけではなく』

『→の値 a に、限りなく近づく』ってことを表してます。

 

 

まあつまり「その値になるわけではない」

ってことが、これではっきり分かるわけですね。

 

 

この部分、かなり重要なので忘れないでください。

 

 

 

念のため厳密な話をしておくと、

極限が求めてるのは『下限・上限』になります。

 

\begin{array}{rlc} x&>0 \\ \\ \displaystyle\lim_{x→0}x&=0 \end{array}

 

なので、範囲に 0 が無い状態でも、

こういう風に書くことが許されるんですよ。

 

 

 

 

 

微小変化量 dx,dy の感覚

 

dx,dy ってのを考える理由は、

『超近くで曲線を見た時のため』って感じでしょうか。

 

 

どういうことかというと、

『曲線が直線に見える近さ』というような、

 

 

『変化が一定に近い領域に近づける』時、

「ほぼ 0 の変化量」を考える必要がある、って話です。

 

\begin{array}{rlc} dx&=\displaystyle \lim_{h→0} (x+h)-x \\ \\ &=0 \\ \\ \\ dy&=\displaystyle \lim_{h→0}f(x+h)-f(x) \\ \\ &=0 \end{array}

 

この dx,dy が『微小変化量』って言われているもので、

「曲線の傾きを求めたい」時とか、

「極細の長方形の面積を求めたい」時に必要になります。

 

 

 

前者は微分ですね。

『直線的に求めることが出来るよう』に、

『曲線の変化量/傾き』を↓みたいに考えます。

 

\begin{array}{rlc} \displaystyle \displaystyle f^{\prime}(x)&\displaystyle =\frac{d}{dx}f(x)\\ \\&\displaystyle=\frac{dy}{dx} \\ \\ &\displaystyle =\lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x} \end{array}

 

この「 f^{\prime}(x) 」が『微分された関数』ですね。

 

 

 

んで、後者は積分になります。

これは『超細い長方形の面積 dS 』を考えるやり方ですね。

 

\begin{array}{rlc} S_0&=f(x+0)×1 \\ \\ S_1&=f(x+1)×1 \\ \\ S_2&=f(x+2)×1 \\ \\ \vdots \\ \\ S_0+S_1+S_2+\cdots+S_n&=S \end{array}

 

\begin{array}{rlc} \displaystyle dS&=f(x)\,dx \\ \\ f(x_1)dx+f(x_1+dx)dx+\cdots+f(x_2-dx)dx&=\displaystyle \int_{x_1}^{x_2} dS \\ \\ &=S \end{array}

 

はい、とまあこういうのを考える時、

『微小変化量 dx 』が必要になるわけです。

 

 

 

 

 

微小変化量と微分

 

やってることは『直線の傾きを求める』のと同じで、

例えば「2つの点を結んだ直線の傾き a 」は、

 

\begin{array}{rlc} \displaystyle \frac{f(x_2)-f(x_1)}{x_2-x_1} &=\displaystyle \frac{(ax_2+b)-(ax_1+b)}{x_2-x_1} \\ \\ &=a \end{array}

 

こうなるじゃないですか。

 

 

んで、『微分』の操作ってのは、

この「点と点の間隔」を『ほぼ 0 にしてる』だけで、

やってることはそっくりそのまま。

 

\displaystyle \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x}=f^{\prime}(x)

 

比較して見てみると、

明らかに同様の操作だと分かります。

 

\begin{array}{rlc} \displaystyle \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x}&=f^{\prime}(x) \\ \\ \displaystyle \frac{f(x_2)-f(x_1)}{x_2-x_1}&=a \end{array}

 

念のため確認しておくと、

これは「 0 にしているわけではない」って点に注意。

 

 

これは「ほぼ 0 に近づける」と、

無視しても特に問題が無い』って感じの操作で、

 

 

0 にしている操作」ではありません。

 

 

あくまで『結果的に 0 に限りなく近い』だけで、

代入とは根本的に異なるので、混同しないように。

 

 

 

話は戻って、ともかくこのようにすると、

『直線以外』でも「傾き」が考えられるようになります。

 

 

具体的には↓みたいに。

 

f(x)=x^2

 

\begin{array}{rlc} \displaystyle f^{\prime}(x)&\displaystyle =\lim_{h→0}\frac{(x+h)^2-x^2}{(x+h)-x} \\ \\ &\displaystyle =\lim_{h→0}\frac{x^2+2hx+h^2-x^2}{h} \\ \\ \\ &\displaystyle =\lim_{h→0}\frac{2hx+h^2}{h} \\ \\ &\displaystyle =\lim_{h→0}2x+h \\ \\ &=2x \end{array}

 

f(x) の「接線 y の傾き f^{\prime}(a) 」は、

「点 x=1 」の時は↓に。

 

\begin{array}{rll} x=1&→&f(1)=1 \end{array}

 

\begin{array}{rlc} \displaystyle y-1&\displaystyle =\lim_{h→0}\frac{(1+h)^2-1^2}{(1+h)-1}(x-1) \\ \\ &=2(x-1) \end{array}

 

具体的な値を入れるとこうなります。

見た目厳ついですけど、どうですか?

そんな難しくないですよね。

 

 

 

 

 

変分法

 

これは『最短経路』を考えるための方法です。

かなり脳筋な発想になります。

 

 

というのもこれは、

まず『全ての経路を変数に持つ関数』を用意して、

「極値(最小値など)を見つける」ってやり方なんです。

 

 

「2点間の最短経路を求める問題」

みたいな問題を解くときに使われるんですが、

聞いての通り、だいぶ無茶なやり方です。

 

 

 

てなわけで厳密な話をしていくと、

これは『経路 f(x) の到達時間 T(y) 』を考えて、

その『極値を求める条件 T^{\prime}(f(x))=0 』を考える。

 

\begin{array}{rlc} \displaystyle y&=f(x) \\ \\ r^2&=x^2+y^2 \\ \\ v&\displaystyle =\frac{dr}{dt} \\ \\ &\displaystyle =\sqrt{\left(\frac{dx}{dt}\right)^2+\left(\frac{dy}{dt}\right)^2} \\ \\ &\displaystyle =\left(\frac{dx}{dt}\right)\sqrt{1+\left(\frac{dy}{dx}\right)^2} \\ \\ \\ dt&\displaystyle =\frac{dt}{dx}dx \\ \\ &\displaystyle =\frac{\sqrt{1+\left(\displaystyle\frac{dy}{dx}\right)^2}}{v} \,dx \\ \\ \\ T&=\displaystyle \int_{0}^{T} dt&\displaystyle \\ \\ &\displaystyle =\int_{0}^{α} \frac{\sqrt{1+\left(\displaystyle\frac{dy}{dx}\right)^2}}{v} \,dx \end{array}

 

具体的にはこんな感じに式変形して、

強引に『到達時間についての関数 T 』を求めることで、

 

 

その関数の「極値(最小値とか)の条件」から、

「最も短い経路を見つけ出す」って感じです。

 

 

 

↑のやつは速度とか座標とか、

よく使う単位で書いてますが、

変数を変えれば別の解釈をすることもできます。

 

 

 

再度確認しておくと、

「2点間の経路」ってのはいくつもあります。

当然、経路によっては到達時間もまちまちです。

 

 

んで、変分法っていうのは、

その中で「極値の条件を満たすもの」を探して、

『最小の経路』を見つけます。

 

 

やってることは、高校で習った

『最小・最大値を見つける』のとそんなに差はありません。

 

 

はい、とまあ大枠としてはこんな感じ。

この辺り、忘れないようにしてください。

 

 

 

ただまあ、これだと抽象的過ぎますよね。

具体的なやつを見てみたくないですか?

 

 

というわけで、代表的な問題である

『最速降下曲線』ってやつの解説をしてみようと思います。

 

 

 

 

 

最速降下曲線の導出

 

「物質が 2 点間を最速で滑り降りる」ための、

『図形』についての、代表的な話がこれ。

 

 

「最小作用の原理」の、

『数学的な定義』を理解するには、

これを導く時の考え方が必要になります。

 

 

 

てなわけで問題の具体的な内容なんですけど、

まず「 2 つの離れたO,P 」を考えます。

 

\begin{array}{rlc} \displaystyle O=(0,0) \\ \\ \\ &P=(a,b) \end{array}

 

問題を単純にするために、

値の正負を定めておきましょうか。

a>0,b>0

 

図形の軸は x 軸の正方向を→とする

図形の軸は y 軸の正方向を↓とする

 

別に「 b<0 」でもいいんですけど、

- を排除したいのでこうしておきます。

 

 

 

重力 mg の方向についても、

y 軸に沿った方向にしておきます。

 

 

まあつまり y>0 なら重力は + に。

ちなみに摩擦は考えません。

 

 

そして次、メインとなる『時間』も考えてみます。

 

 

そうすると、

『滑り落ちるものの速度は一定じゃない』っていう、

重力を受けて加速してる事実を考慮する必要が。

 

 

 

んでまあこういう風に現実の落下を考慮して、

「速度 v(y) 」を計算しておくと、

 

 

エネルギー保存則から導くことが。

高さ y ・初速 v(0)=0 とします。

 

\begin{array}{rlc} \displaystyle \frac{1}{2}mv^2(0)+mg(a-0)&\displaystyle =\frac{1}{2}mv^2(y)+mg(a-y) \\ \\ \displaystyle mga&\displaystyle =\frac{1}{2}mv^2(y)+mg(a-y) \\ \\ \\ \displaystyle ga&\displaystyle =\frac{1}{2}v^2(y)+g(a-y) \\ \\ \displaystyle ga-g(a-y)&\displaystyle =\frac{1}{2}v^2(y) \\ \\ \displaystyle gy&\displaystyle =\frac{1}{2}v^2(y) \end{array}

 

v(y)=\sqrt{2gy}

 

これは見覚えがあるかと。

単純な式変形ですぐに求まります。

 

 

 

 

 

速度

 

「速度」を表す方法は、実はいくつかあります。

具体的には『位置 y でみるやり方』と、

『時間 t でみるやり方』の2つがあるんですよ。

 

v=\sqrt{2gy}

 

↑で求めたのは「 y から見た速度」で、

意味は『位置 y での速度』です。

 

 

重力による加速の方向は一方向のみですから、

このように書くことができるのは分かるかと。

 

 

 

とはいえ速度ですから、

移動距離の長さを l とすると、

 

\displaystyle v=\frac{dl}{dt}

 

『時間 t での速度』として、

このような表現も考えられますよね?

 

 

これはまあ、そういう話です。

 

 

というわけで「速度」について、

少し整理しておきます。

 

 

 

まず「長さ l 」を考えてみましょうか。

この部分、よく分かりませんし。

 

 

といっても求める方法は簡単で、

ただ「三平方の定理」を使うだけで求まります。

 

\begin{array}{rlc} \displaystyle l^2&=x^2+y^2 \end{array}

 

直線の場合はこう。

となると、これを曲線で考える場合、

 

\begin{array}{rlc} dl&=\displaystyle \sqrt{dx^2+dy^2} \\ \\ &=\displaystyle \sqrt{dx^2+df^2(x)} \end{array}

 

このようにすれば、

近い距離で成立します。

 

 

 

ここの部分はまだよく分かんないと思いますが、

軌跡 y=f(x) の部分は、

 

\displaystyle f^{\prime}(x)=\frac{df(x)}{dx}

 

この関係を考慮して、

位置の変化量 dx を取り出しておきます。

 

\begin{array}{rlc} \displaystyle \sqrt{dx^2+df^2(x)}&\displaystyle =\displaystyle \sqrt{dx^2+dx^2\left( \frac{df(x)}{dx}\right)^2 } \\ \\ &\displaystyle =\displaystyle dx\sqrt{1+\left( \frac{df(x)}{dx}\right)^2 } \end{array}

 

これは後で「変数を減らすための操作」だと分かるんですけど、

この時点ではノーヒントなので、今はスルーで。

 

 

 

一応、長さについて書いておくと、

「範囲 0≤x での和」をとればいいので、

 

l=\displaystyle \int_{0}^{x}\sqrt{1+\left( \frac{df(x)}{dx}\right)^2 }\,dx

 

こうなるのが分かるかと。

意味的には「超短い接線の集まり」って感じ。

 

 

 

ともかく、長さは↑なので、

「時間変化での速度」は↓になります。

 

\begin{array}{rlc} \displaystyle \frac{dl(x)}{dt}&\displaystyle =\frac{\displaystyle \sqrt{1+\left( \frac{df(x)}{dx}\right)^2 }\,dx}{dt} \\ \\ &\displaystyle =\displaystyle \sqrt{1+(f^{\prime}(x))^2 }\frac{dx}{dt} \end{array}

 

はい、とまあこんな感じにすれば、

『時間と長さ』で「速度」を表現できます。

 

 

 

 

 

到達時間についての関数

 

「最短になる経路」を求めるために、

『到達時間の関数』を求めてみます。

 

 

とりあえず式を整理していきましょうか。

 

\begin{array}{rlc} \displaystyle v&\displaystyle =\sqrt{2gy} \\ \\ v&\displaystyle =\sqrt{1+(f^{\prime}(x))^2 }\,\frac{dx}{dt} \end{array}

 

これから「到達時間の関数 T 」を作ってみます。

そのために、とりあえず式変形。

 

\begin{array}{rlc} \displaystyle \sqrt{2gy} &\displaystyle = \sqrt{1+(f^{\prime}(x))^2 }\,\frac{dx}{dt} \\ \\ \displaystyle \frac{\sqrt{2gy}}{\sqrt{1+(f^{\prime}(x))^2 }} &\displaystyle = \frac{dx}{dt} \end{array}

 

するとまあこうなります。

 

 

んで次、「時間についての関数」を得るために、

y 軸と t 軸を入れ替えてみると、

 

\displaystyle \frac{dt}{dx}=\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}

 

このように、

「横移動の微小変化量 dx 」辺りの

『時間の微小変化量 dt 』が求まりますね。

 

 

位置 x で高さ y は変わるので、

これは直観的に理解できるかと思います。

 

\displaystyle dt=\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}\,dx

 

でまあこう変形して「微小時間の和」を考えれば、

x=0 から x=k 』までの範囲だと、

 

\begin{array}{rlll} x(T)&=x \\ \\ x(c)&=k \end{array}

 

\begin{array}{rlc} \displaystyle T:&0&→&c \\ \\ \displaystyle x:&0&→&k \end{array}

 

『何秒で到達するのか』を求めることができます。

 

\displaystyle T(f(x))=\int_{0}^{k}\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}\,dx

 

はい、とまあこんな感じに、

『最短経路 f(x) 』を求める問題を考えた結果、

 

\begin{array}{rlc} f(0)&=0 \\ \\ f(a)&=b \end{array}

\displaystyle T(f(x))=\int_{0}^{a}\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}\,dx

 

こんなよく分かんない形をした、

到達時間の関数 T(f(x)) が求まりました。

 

 

 

ちなみに具体的な経路 y=f(x) を決めると、

この式は↓みたいな感じになります。

 

\displaystyle T(f(x))=\int_{0}^{a}\frac{\sqrt{1+(f^{\prime}(x))^2 }}{\sqrt{2gy}}\,dx

 

 

\begin{array}{rlc} \displaystyle f(x)&=x \\ \\ f^{\prime}(x)&=1 \end{array}

 

\begin{array}{rlc} \displaystyle T(x)&\displaystyle =\int_{0}^{a}\frac{\sqrt{1+(1)^2 }}{\sqrt{2gx}}\,dx \\ \\ &\displaystyle =\int_{0}^{a}\frac{\sqrt{2}}{\sqrt{2gx}}\,dx \\ \\ &\displaystyle =\frac{1}{\sqrt{g}}\int_{0}^{a}\frac{1}{\sqrt{x}}\,dx \end{array}

 

 

\begin{array}{rlc} \displaystyle f(x)&=x^2 \\ \\ f^{\prime}(x)&=2x \end{array}

 

\begin{array}{rlc} \displaystyle T(x^2)&\displaystyle =\int_{0}^{a}\frac{\sqrt{1+(2x)^2 }}{\sqrt{2gx^2}}\,dx \\ \\ &\displaystyle =\frac{1}{\sqrt{2g}}\int_{0}^{a}\left( \sqrt{\frac{1}{x^2}}+\sqrt{\frac{(2x)^2 }{x^2}} \right)\,dx \end{array}

 

経路を表す関数 f(x) の中身はこんななので、

計算はこんな感じになっちゃいます。

 

 

 

 

 

最短経路と方向微分

 

最短経路についてですけど、

ここで、わりと特殊な操作を行います。

 

\begin{array}{rlc} \displaystyle δT(f(x))&\displaystyle =\lim_{ε→0} T(f(x)+v(t+ε-t))-T(f(x)) \\ \\ df(x)&\displaystyle =\lim_{ε→0}(f(x)+v(t+ε-t))-f(x) \\ \\ \\ \displaystyle\frac{ δT(f(x))}{df(x)}&\displaystyle =\frac{ δT(f(x))}{dt} \\ \\ &\displaystyle =\lim_{ε→0}\frac{T(f(x)+vε)-T(f(x))}{(t+ε)-t} \end{array}

 

というのも「多変数関数の微分」なので、

『ガトー微分』っていうのをとるんです。

 

 

ただまあガトー微分って言われても

字面じゃ意味が全く分かんないんで、

 

\begin{array}{rlc} \displaystyle \frac{d}{dt}f(x(t),y(t))&=\displaystyle \lim_{ε→0}\frac{f(x,y)+(v_1ε,v_2ε))-f(x,y)}{(t+ε)-t} \\ \\ &=\displaystyle \lim_{ε→0}\frac{f(x+dx,y+dy)-f(x,y)}{(t+ε)-t} \end{array}

 

「方向微分」って言っておきます。

基本はこっちだと思っておいてください。

 

 

まあ、名前はあんまり気にしないように。

操作自体は普通の微分とあんまり変わりません。

 

 

単に「直交系」の考え方を使って、

xf(x) を同時に動かしてるだけです。

 

 

 

イメージとしては、

要は複素数のあれの感じで、

 

\begin{array}{rlc} \displaystyle x&=r\cos ωt \\ \\ y&=r\sin ωt \end{array}

 

『超短い時間での変化 dt 』を使って、

『超小さい範囲の経路の変化 dy 』を、

上下に動かして調整する感じになります。

 

 

まあつまり v の役割は調整ですね。

『向きを決めてるベクトル v 』です。

ちなみに文字は何でもOK。

 

 

 

と言ってもこれじゃよく分かんないと思います。

なにより「多変数関数」ですから、

計算がよく分かりませんし。

 

 

 

 

 

偏微分と全微分の意味

 

↑を説明するためには「偏微分」が必要なので、

ここでちゃんと説明しておきます。

 

\begin{array}{rlll} \displaystyle df&\displaystyle =&\displaystyle\frac{\partial f}{\partial x}dx&\displaystyle +\frac{\partial f}{\partial y}dy \\ \\ \displaystyle \frac{d}{dt}f&\displaystyle =&\displaystyle\frac{\partial f}{\partial x}\frac{dx}{dt}&\displaystyle +\frac{\partial f}{\partial y}\frac{dy}{dt} \end{array}

 

偏微分ってのは、ざっと説明すると、

『多変数関数の時に使う微分』のことです。

 

 

記号での表現については、

2変数関数 z=f(x,y) を考えた時、

 

\begin{array}{ccc} \displaystyle \frac{\partial}{\partial x}f(x,y),&\displaystyle\frac{\partial}{\partial x}f,&\displaystyle\frac{\partial f}{\partial x} \\ \\ \displaystyle \frac{\partial}{\partial y}f(x,y),&\displaystyle\frac{\partial}{\partial y}f,&\displaystyle\frac{\partial f}{\partial y} \end{array}

 

こんな風に書かれることが多いですね。

 

 

見た目厳つくて抵抗あると思うんですけど、

基本は普通の微分と変わりません。

 

f(x,y)=x^2+y^2

 

\begin{array}{rlc} \displaystyle \frac{\partial}{\partial x}f(x,y)&=(x^2)^{\prime}+(y^2)^{\prime} \\ \\ &=2x \\ \\ \\ \displaystyle \frac{\partial}{\partial y}f(x,y)&=(x^2)^{\prime}+(y^2)^{\prime} \\ \\ &=2y \end{array}

 

具体的な感じだと、

「偏微分される」とこんな感じになります。

 

 

やってることは、

『関数と1つの変数だけ』に注目して、

『その他の点を固定(定数に)』して微分する、という感じ。

 

\begin{array}{rlc} \displaystyle \frac{\partial f(x,y)}{\partial x}&\displaystyle =\lim_{h→0}\frac{f(x+h,y)-f(x,y)}{(x+h)-x} \\ \\ \displaystyle \frac{\partial f(x,y)}{\partial y}&\displaystyle =\lim_{h→0}\frac{f(x,y+h)-f(x,y)}{(y+h)-y} \end{array}

 

まあつまり、やってることも意味も、

1変数の微分とほぼ同じ、です。

 

 

 

ただ、全微分ってのを考えた時、

ちょっとこれだと問題があるんですよ。

 

 

というのも、

偏微分は『平面に限定する』ことで

『接線の傾き』を求めてるわけなんですが、

 

 

全微分をすると、

『すべての変数を動かす』ことになるので、

2 変数なら『接平面の傾き』を求めることになります。

 

 

どういうことかというと、

このままだと、よく分かんないんですよ。

 

\begin{array}{rlc} \displaystyle dz&=df(x,y) \\ \\ &=f(x+dx,y+dy)-f(x,y) \end{array}

 

何を求めたいのかはわかってます。

でも、具体的な計算ってどうすればいいんでしょう?

 

 

 

結論としては、

『座標』から「図形的に」式を求めます。

 

 

どういうことかというと、

それぞれの『座標』を考えるんですよ。

 

\begin{array}{llc} x,y+dy&x+dx,y+dy \\ \\ x,y&x+dx,y \end{array}

 

初期位置を原点 (0,0) と考えて

シンプルにしてみましょうか。

 

\begin{array}{llc} 0,dy&dx,dy \\ \\ 0,0&dx,0 \end{array}

 

x で決まる空間上の点 z の座標と

y で決まる空間上の点 z の座標

これを別々に考えてみると、

 

\begin{array}{rllll} \displaystyle f(x,y)&=x+y \\ \\ \\ f(0,0)&=0+0 \\ \\ \\ &f(0+1,0)&=1+0 \\ \\ &f(0,0+1)&=0+1 \\ \\ \\ &&f(0+1,0+1)&=1+1 \end{array}

 

具体的にはこんな感じになりますよね。

 

 

んでこれを一般化すると、

 

\begin{array}{rlc} f(x+dx,y)&=f(x,y)+df(x+dx,y) \\ \\ f(x,y+dy)&=f(x,y)+df(x,y+dy) \\ \\ \\ \\ z+dz&=f(x,y)+df(x+dx,y+dy) \\ \\ &=f(x+dx,y+dy) \\ \\ \\ &= \displaystyle f(x,y)+df(x+dx,y)+df(x,y+dy) \\ \\ &=f(x,y)+ \displaystyle \frac{\partial }{\partial x}f(x,y)\,dx+\frac{\partial }{\partial y}f(x,y) \,dy\end{array}

 

こんな感じになって、

こうすると dz が具体的に求まるじゃないですか。

 

\begin{array}{rlc} dz&=\displaystyle df(x+dx,y+dy) \\ \\ &=\displaystyle \frac{\partial }{\partial x}f(x,y)\,dx+\frac{\partial }{\partial y}f(x,y) \,dy \end{array}

 

まあ要は、こういう話です。

ただの座標の足し算。

 

 

 

順番にまとめると、

座標 z+dz を求める手順を考えて、

 

 

まず『 x の変化による z=f(x,y) の変化』を、

x,z 平面だけ見て↓を導きます。

 

\begin{array}{llc} \displaystyle f(x+dx,y)&\displaystyle =f(x,y)+\frac{\partial f(x,y)}{\partial x}dx \\ \\ \displaystyle f(x+dx,y)-f(x,y) &\displaystyle =\frac{\partial z}{\partial x}dx \end{array}

 

偏微分の部分については

↓みたいに考えると納得できるかと。

 

\begin{array}{rlc} \displaystyle \partial x&\displaystyle =\lim_{h→0}(x+h)-x \\ \\ dx&\displaystyle =\lim_{h→0}(x+h)-x \\ \\ \\ \displaystyle \frac{\partial z}{\partial x} &\displaystyle =\lim_{h→0}\frac{f(x+h,y)-f(x,y)}{(x+h)-x} \\ \\ &\displaystyle =\frac{f(x+dx,y)-f(x,y)}{dx} \end{array}

 

んで同じように y,z 平面で見れば、

 

\displaystyle f(x,y+dy)-f(x,y) =\frac{\partial z}{\partial y}dy

 

これが導けるので、

 

 

後は x,y の両方を動かした z の微小変化 dz を、

図形的に、座標を足し合わせて求めます。

 

\begin{array}{rlc} \displaystyle f(x+dx,y)-f(x,y) &\displaystyle =df(x+dx,y) \\ \\ &\displaystyle =\frac{\partial f(x,y)}{\partial x}dx \\ \\ \displaystyle f(x,y+dy)-f(x,y)&\displaystyle =df(x,y+dy) \\ \\&\displaystyle =\frac{\partial f(x,y)}{\partial y}dy \end{array}

 

\begin{array}{rlc}z+dz&=\displaystyle f(x+dx,y+dy) \\ \\ &=f(x,y)+df(x+dx,y)+df(x,y+dy) \\ \\ \\ &\displaystyle =f(x,y)+\frac{\partial f(x,y)}{\partial x}dx+\frac{\partial f(x,y)}{\partial y}dy \end{array}

 

\begin{array}{rlc}\displaystyle dz&=f(x+dx,y+dy)-f(x,y) \\ \\ &\displaystyle =\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy \end{array}

 

んでこれを、極座標の感覚を使って、

x,y の両方が t で変化するようにすれば、

全微分は、↓みたいに書くことができます。

 

\begin{array}{rlll} \displaystyle x&=x(t)&&(=\cos t,r \cos t ,...) \\ \\ \displaystyle y&=y(t)&&(=\sin t,r\sin t ,...) \end{array}

 

\displaystyle \frac{dz}{dt}=\frac{\partial z}{\partial x}\frac{dx}{dt}+\frac{\partial z}{\partial y}\frac{dy}{dt}

 

これが、全微分と偏微分の意味です。

セットで覚えるのがベスト。

 

 

 

 

 

全微分と方向微分

 

↑で出てきた「全微分」を、

『ベクトル v を使って』一般化したら、

 

\begin{array}{rlc} \displaystyle \frac{d}{dt}f(x,y)&\displaystyle =\frac{\partial f(x,y)}{\partial x}\frac{dx}{dt}+\frac{\partial f(x,y)}{\partial y}\frac{dy}{dt} \\ \\ &\displaystyle = \frac{f(x+dx,y+dy)-f(x,y)}{dt} \\ \\ \\ &\displaystyle =\lim_{ε→0} \frac{f(x+dx,y+dy)-f(x,y)}{(t+ε)-t} \\ \\ &\displaystyle =\lim_{ε→0} \frac{f((x,y)+(dx,dy))-f(x,y)}{(t+ε)-t} \\ \\ \\ &\displaystyle =\lim_{ε→0} \frac{f((x,y)+εv)-f(x,y)}{(t+ε)-t} \end{array}

 

「方向微分」が得られます。

これはまあ、こんだけ。

 

 

ちなみにこれをさらに一般化したのがガトー微分です。

これは特に気にしなくてOK。

 

 

重要なのは「ベクトルで多変数を表現する感覚」と、

複数の座標を時間の関数とする「極座標の感覚」で、

↑の式は、その結果として得られるものになります。

 

 

 

 

 

 

ラグランジアン

 

|| 基本の変数で作れる関数を一般化

これは『一般化された象徴的な関数』の中でも、

特に「座標・座標の微分」で書かれてるやつのこと。

 

 

具体的には、例えば「エネルギー」とかだと

 

\begin{array}{rlc} \displaystyle E&\displaystyle =\frac{1}{2}mv^2+V(q) \\ \\ &\displaystyle =\frac{1}{2}m(v_{x}^{2}+v_{y}^{2})+V(x,y) \\ \\ \\ &\displaystyle =\frac{1}{2}m\frac{dq}{dt}+V(q) \end{array}

 

このように書けるじゃないですか。

 

 

他にも「到達時間」を求める時に出てくる

『長さについての関数』を考える時、

 

\begin{array}{rlc} \displaystyle dl&=\sqrt{dx^2+dy^2} \\ \\ &\displaystyle =dx\sqrt{1+\left( \frac{dy}{dx} \right)^2} \end{array}

 

\begin{array}{rlc} \displaystyle v&\displaystyle =\frac{dl}{dt} \\ \\ &\displaystyle =\frac{dx}{dt}\sqrt{1+\left(\displaystyle\frac{dy}{dx}\right)^2} \\ \\ \\ v\,dt&=dx\sqrt{1+(y^{\prime})^2} \\ \\ dt&\displaystyle =\frac{\sqrt{1+(y^{\prime})^2}}{v}\,dx \end{array}

 

\begin{array}{rlc} \displaystyle dt&\displaystyle =\frac{dl}{v} \\ \\ &\displaystyle=\frac{\sqrt{1+(y^{\prime})^2+(z^{\prime})^2+\cdots}}{v}\,dx \end{array}

 

こういうのが出てきて、

その時の「変数のパターン」ってあるじゃないですか。

 

 

 

つまりはまあそんな感じで、

特に「位置とその微分」を変数に持つ関数は、

全部ラグランジアンって呼ぶことにしてるんですよ。

 

\begin{array}{rlc} I&=\displaystyle \int_{}^{} L\left(q,\frac{d}{d t}q,t\right) \,dt \\ \\ &\displaystyle =\int_{}^{} L(q(t),\dot{q}(t),t) \,dt \\ \\ &\displaystyle =\int_{}^{} L(q(t),q^{\prime}(t),t) \,dt \\ \\ &\displaystyle =\int_{}^{} L(q,q^{\prime},t) \,dt \\ \\ &\displaystyle =\int_{}^{} L \,dt \end{array}

 

この L(q,q^{\prime}) がラグランジアンです。

q(t) が一般化座標 (x,y,z,...) を表してて、

q^{\prime}(t) は基本的に速度を表してます。

 

 

見た目難しいですけど、要は「 f(x) 」と同じです。

これ自体に特に意味はありません。

単に書くのが面倒だから省略してるだけ。

 

 

 

これが意味を持つようになるのは

これを『使うとき』でして、

 

\begin{array}{rlc} \displaystyle I&=\displaystyle \int_{}^{} L\left(q,q^{\prime}\right) \,dt \end{array}

 

具体的には↑のような関数(汎関数)をとると、

↓みたいなけっこう便利な方程式が導けたりします。

 

\begin{array}{rlc} \displaystyle \frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}&=0 \end{array}

 

これはラグランジュの運動方程式って呼ばれてて、

「変分原理」とセットで導かれるものになりますね。

 

 

 

まとめると、ラグランジアンっていうのは、

『変数が座標と速度に限定された単なる関数』のことで、

主に変分原理の主張を表すときに使われます。

 

 

 

 

 

ラグランジュの運動方程式

 

これは「変分原理」から導かれるもので、

簡単に言うと『計算を簡単にするためのもの』です。

 

\begin{array}{lll} \displaystyle \frac{\partial L}{\partial q}&\displaystyle -\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}&=0 \\ \\ \displaystyle \frac{\partial L}{\partial q}&\displaystyle-\frac{d}{dt}\frac{\partial L}{\partial \dot{q}}&=0 \\ \\ \displaystyle \frac{\partial}{\partial q}L(q(t),\dot{q}(t))&\displaystyle-\frac{d}{dt}\frac{\partial}{\partial \dot{q}}L(q(t),\dot{q}(t))&=0 \end{array}

 

\displaystyle \frac{\partial L}{\partial q}=\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}

 

見た目はちょっと厳つく見えますけど、

式自体はかなり単純。

 

\displaystyle\frac{\partial L}{\partial q}

 

これを計算して、

 

\displaystyle\frac{\partial L}{\partial q^{\prime}}

 

これを計算して、

 

\displaystyle\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}

 

これを計算するだけ。

 

 

この方程式を使うと、

問題の計算がすごく単純になることが分かると思います。

 

 

 

 

 

ラグランジュ方程式の導出

 

これの導出のやり方なんですけど、

基本は変分法の感覚に近いです。

 

\displaystyle I(q(t))=\int_{t_1}^{t_2}L(q,\dot{q})\,dt

 

というのも、これを求めるために、

こういうやつを使うんですよ。

 

 

 

これ何? って話だと思うんですけど、

結論としては、「作用」って呼ばれてるものでして、

「単体で見ると、特に意味の無いもの」ですね。

 

 

具体的にすると意味が出てきて、

例えば『到達時間の関数』って意味を持つことがあったり。

 

\begin{array}{rlc} \displaystyle T&\displaystyle =\int dt \\ \\ \displaystyle dt&\displaystyle =\frac{dl}{v} \end{array}

 

まあつまり「作用」ってのは、

こういう「関数 T のようなもの」を考える時の、

 

I^{\prime}=0

 

『最小値などを求めるために必要な手順の1つ』

みたいな感覚のものになります。

 

 

 

と言ってもよく分かんないと思うので、

とりあえずこれを使って考えてみましょうか。

 

\begin{array}{rlc} \displaystyle dI(q)&=I(q+dq)-I(q) \\ \\ &\displaystyle =\int_{t_1}^{t_2}L(q+dq,\dot{q}+d\dot{q})\,dt-\int_{t_1}^{t_2}L(q,\dot{q})\,dt \\ \\ &\displaystyle =\int_{t_1}^{t_2}\Bigl( L(q+dq,\dot{q}+d\dot{q})-L(q,\dot{q}) \Bigr) \,dt \end{array}

 

まあ見ての通り、この状態だと何もできません。

 

 

ただ、↓の関係を思い出してみてください。

 

\begin{array}{llc} \displaystyle L(q+dq,q^{\prime}+dq^{\prime}) \\ \\ \displaystyle =L(q,q^{\prime})+\frac{\partial L(q,q^{\prime})}{\partial q}dq +\frac{\partial L(q,q^{\prime})}{\partial q^{\prime}}dq^{\prime} \end{array}

 

偏微分の座標の足し算を考えると、

L(q+dq,q^{\prime}+dq^{\prime}) を書き換えることができます。

 

 

てなわけでそのまま式変形。

 

\begin{array}{rlc} \displaystyle \left( L(q,\dot{q})+\frac{\partial L(q,q^{\prime})}{\partial q}dq +\frac{\partial L(q,q^{\prime})}{\partial q^{\prime}}dq^{\prime} \right)-L(q,\dot{q}) \\ \\ \displaystyle =\frac{\partial L(q,q^{\prime})}{\partial q}dq +\frac{\partial L(q,q^{\prime})}{\partial q^{\prime}}dq^{\prime} \end{array}

 

\begin{array}{llc} \displaystyle \int_{t_1}^{t_2}\Bigl( L(q+dq,\dot{q}+d\dot{q})-L(q,\dot{q}) \Bigr) \,dt \\ \\ \displaystyle =\int_{t_1}^{t_2}\left( \frac{\partial L(q,q^{\prime})}{\partial q}dq +\frac{\partial L(q,q^{\prime})}{\partial q^{\prime}}dq^{\prime} \right) \,dt \\ \\ \\ \displaystyle =\int_{t_1}^{t_2}\left( \frac{\partial L}{\partial q}dq +\frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt \end{array}

 

するとまあ、こうなりますよね。

LL(q,q^{\prime}) の表現を省略してるだけ。

 

 

 

ただまあこれ、いくらかはスッキリしましたが、

この時点でもまだよく分かんなくないですか?

 

\begin{array}{rlc} \displaystyle dq \\ \\ dq^{\prime}&\displaystyle =\frac{dq}{dt} \end{array}

 

なので、とりあえずここを揃えてみます。

整理できる部分はここくらいですし。

 

\begin{array}{clc} \displaystyle \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \\ \\ \displaystyle \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt \end{array}

 

てなわけで、これを変形してみましょうか。

とっかかりが特に無いので、部分積分を使ってみます。

 

\begin{array}{rlc} \displaystyle \Bigl( f(x)g(x) \Bigr)^{\prime}&=f^{\prime}(x)g(x)+f(x)g^{\prime}(x) \\ \\ \\ \displaystyle \int_{a}^{b} \Bigl( f(x)g(x) \Bigr)^{\prime} \, dx&\displaystyle =\int_{a}^{b} f^{\prime}(x)g(x)\,dx+\int_{a}^{b} f(x)g^{\prime}(x)\,dx \\ \\ \displaystyle \Bigl[ f(x)g(x) \Bigr]_{a}^{b}&\displaystyle =\int_{a}^{b} f^{\prime}(x)g(x)\,dx+\int_{a}^{b} f(x)g^{\prime}(x)\,dx \end{array}

 

これをそのまま使えば、

 

\displaystyle \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt

 

\displaystyle \left[ \frac{\partial L}{\partial q^{\prime}}dq \right]_{t_1}^{t_2}=\int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt+\int_{t_1}^{t_2} \left( \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}dq \right) \,dt

 

定数 c として考えると、

←のやつを消せますから、

 

\begin{array}{rlc} \displaystyle\left[ \frac{\partial L}{\partial q^{\prime}} \right]_{t_1}^{t_2}&=c \\ \\ \\ \displaystyle \left[ \frac{\partial L}{\partial q^{\prime}}dq \right]_{t_1}^{t_2}&\displaystyle=\left[ \frac{\partial L}{\partial q^{\prime}} \right]_{t_1}^{t_2}\left[dq\right]_{t_1}^{t_2} \\ \\ &\displaystyle =c\left[\lim_{h→0} (q+h)-q\right]_{t_1}^{t_2} \\ \\ &=0 \end{array}

 

結果的に、↓の等式が導けます。

 

\begin{array}{rll} \displaystyle \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt&\displaystyle +\int_{t_1}^{t_2} \left( \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}dq \right) \,dt&=0 \\ \\ \displaystyle \int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt&\displaystyle =-\int_{t_1}^{t_2} \left( \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}dq \right) \,dt \end{array}

 

後はこれを元の式に入れれば、

 

\begin{array}{llc} \displaystyle \int_{t_1}^{t_2}\left( \frac{\partial L}{\partial q}dq +\frac{\partial L}{\partial q^{\prime}}dq^{\prime} \right) \,dt \\ \\ \displaystyle =\int_{t_1}^{t_2} \frac{\partial L}{\partial q}dq \,dt +\int_{t_1}^{t_2}\frac{\partial L}{\partial q^{\prime}}dq^{\prime} \,dt \\ \\ \\ \displaystyle =\int_{t_1}^{t_2} \frac{\partial L}{\partial q}dq \,dt -\int_{t_1}^{t_2} \left( \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}dq \right) \,dt \\ \\ \displaystyle =\int_{t_1}^{t_2} \left( \frac{\partial L}{\partial q} - \frac{d}{dt}\frac{\partial L}{\partial q^{\prime}} \right) \,dq \,dt \end{array}

 

このようになって、

最後、上の式と『変分原理』の主張を考えると、

 

\begin{array}{rlc} \displaystyle dI(q)&\displaystyle =\int_{t_1}^{t_2} \left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\right)\,dq \,dt \\ \\ \displaystyle \frac{dI(q)}{dt}&\displaystyle =\frac{d}{dt}\int_{t_1}^{t_2} \left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\right)\,dq \,dt \\ \\ &=0 \end{array}

 

\begin{array}{rlc} \displaystyle \frac{dI(q)}{dt}&\displaystyle =\left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\right)\,dq \\ \\ &=0 \end{array}

 

このようになるので、

あとは自然に式変形していけば、

結果的に↓が導かれます。

 

\begin{array}{rlc} \displaystyle \left(\frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\right)\,dq &=0 \\ \\ \displaystyle \frac{\partial L}{\partial q}\,dq&\displaystyle =\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\,dq \\ \\ \displaystyle \frac{\partial L}{\partial q}&\displaystyle =\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}\end{array}

 

後はこれを好きなように書く感じですね。

一番見るのは↓ですけど。

 

\begin{array}{rlc} \displaystyle \frac{\partial L}{\partial q}-\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}&=0 \end{array}

 

まあともかくこう見ると、

なんか、けっこうすっきりしましたよね。

 

 

 

はい、まあそんな感じで、

なんかスッキリしたこの式を、

 

\begin{array}{lll} \displaystyle \frac{\partial L}{\partial q}&\displaystyle -\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}}&=0 \\ \\ \displaystyle \frac{\partial L}{\partial q}&\displaystyle =\frac{d}{dt}\frac{\partial L}{\partial q^{\prime}} \end{array}

 

「ラグランジュの運動方程式」

という風に呼ぶことにしたんですよ。

 

 

 

 

 

最短経路とラグランジュ方程式

 

保留していた「最短経路」の問題について、

↑の運動方程式を使って解説していきます。

 

\begin{array}{rlc} \displaystyle T&\displaystyle =\int dt \\ \\ &\displaystyle =\int \frac{1}{v}\,dl \end{array}

 

というか、基本的に↑のを使わないと解けません。

いや、まあ解けはするんですけど、

結局似たような手順を踏むことになります。

 

 

ともかく話を進めていくと、

こいつは↓みたいに考えて解く感じです。

 

\begin{array}{rlc} \displaystyle T&\displaystyle =\int \frac{\sqrt{1+(y^{\prime})^2}}{\sqrt{2gy}} dx \\ \\ &\displaystyle =\int L(y,y^{\prime}) \,dx \end{array}

 

L をラグランジュ方程式に入れれば、

 

\begin{array}{rlc} \displaystyle \frac{\partial }{\partial q}L(y,y^{\prime}) -\frac{d}{dt}\frac{\partial }{\partial q^{\prime}}L(y,y^{\prime})&=0 \\ \\ \end{array}

\begin{array}{rlc} L(y,y^{\prime})&\displaystyle =\sqrt{\frac{1+(y^{\prime})^2}{2gy}} \end{array}

 

まあ普通にこうなって、後は解くだけですよね。

 

 

 

でまあ、これを解いてもいいんですけど、

実はこれ、だいぶ計算が複雑です。

 

\begin{array}{rll} \displaystyle \frac{1}{2gc^2}&=2r \\ \\ &=\mathrm{const.} \end{array}

 

\begin{array}{rlc} \displaystyle y^{\prime}&\displaystyle =\sqrt{\frac{2r-y}{y}} \\ \\ &\displaystyle =\sqrt{\frac{r(1+\cos θ )}{r(1-\cos θ )}} \end{array}

 

\displaystyle \left\{\begin{array}{rlc} \displaystyle x&=r(θ-\sin θ) \\ \\ y&=r(1-\cos θ) \end{array}\right.

 

答えはまあこれなんですけど、

 

\begin{array}{rlc} \displaystyle \frac{\partial }{\partial q}L(y,y^{\prime}) -\frac{d}{dt}\frac{\partial }{\partial q^{\prime}}L(y,y^{\prime})&=0 \\ \\ \end{array}

 

これ、↑のままだと計算が超面倒。

 

 

 

なので計算をする前の段階で、

ある操作を行っておきます。

 

L(q,q^{\prime})=L(y,y^{\prime})

 

何の話かと言うと、

L には含まれてない変数 x があるので、

この式をちょっと簡単にできそう、みたいな話です。

 

 

 

 

 

ベルトラミの公式

 

ラグランジュの運動方程式は簡単にできます。

このパターンは位置 q が一方向( x 無し)の話ですね。

 

\begin{array}{rlc} \displaystyle \frac{d}{dx}\left(L(y,y^{\prime})-y^{\prime}\frac{\partial }{\partial y^{\prime}}L(y,y^{\prime}) \right) &=0 \\ \\ \displaystyle L(y,y^{\prime})-y^{\prime}\frac{\partial }{\partial y^{\prime}}L(y,y^{\prime})&=\mathrm{const.} \end{array}

 

この場合、 \mathrm{const.} をなんらかの定数と考えて、

方程式をこのような形に変形できます。

 

 

 

まあ、とりあえずこれを導いてみましょうか。

これの何が嬉しいかは後で解説。

 

\begin{array}{rlc} \displaystyle dL&\displaystyle =\frac{\partial L(y,y^{\prime})}{\partial y}dy+\frac{\partial L(y,y^{\prime})}{\partial y^{\prime}}dy^{\prime} \\ \\ 0&=\displaystyle \frac{\partial }{\partial q}L(y,y^{\prime}) -\frac{d}{dt}\frac{\partial }{\partial q^{\prime}}L(y,y^{\prime}) \end{array}

 

まず発想なんですけど、

これは「全微分」と「ラグランジュ方程式」から

連立方程式を作ってみよう、って感じでして、

 

\begin{array}{rlc} \displaystyle dL&\displaystyle =\frac{\partial L}{\partial y}dy+\frac{\partial L}{\partial y^{\prime}}dy^{\prime} \\ \\ 0&=\displaystyle \frac{\partial L}{\partial y} -\frac{d}{dx}\frac{\partial L}{\partial y^{\prime}} \end{array}

 

試しに、これのどこかを合わせてみたら、

なんか簡単になった、みたいな。そんな感じです。

 

 

 

というわけで早速求めていきましょうか。

そのために、まずは全微分の確認からしていきます。

 

\begin{array}{rlc} \displaystyle \frac{d}{dx}L&\displaystyle =\frac{\partial L}{\partial y}\frac{dy}{dx}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \\ \\ &\displaystyle =\frac{\partial L}{\partial y}y^{\prime}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \end{array}

 

んで次、合いそうな箇所があるので、

微分を考慮しつつ→側に y^{\prime} を入れてみます。

 

\begin{array}{rlc} 0&=\displaystyle \frac{\partial L}{\partial y}y^{\prime} -\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime} \end{array}

 

整理すると↓みたいに。

 

\begin{array}{rlc} \displaystyle \displaystyle \frac{d}{dx}L&\displaystyle =\textcolor{pink}{\frac{\partial L}{\partial y}y^{\prime}}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \\ \\ 0&=\displaystyle \textcolor{pink}{\frac{\partial L}{\partial y}y^{\prime}} -\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime} \end{array}

 

で、後は ↑の式 - ↓の式 をして、

共通するやつを消せば↓が。

 

\begin{array}{rlc} \displaystyle \frac{d}{dx}L&\displaystyle =\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \end{array}

 

ただこれだと、→のやつがよく分かりません。

どうにか単純な形になるように変形したいです。

 

 

 

ということで式をよく見てみると、

 

\begin{array}{rlc} \displaystyle \left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime}&\displaystyle +\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \\ \\ \\ f^{\prime}(x)g(x)&+f(x)g^{\prime}(x) \\ \\ \displaystyle \left( \frac{d}{dx}f(x) \right) g(x)&\displaystyle +f(x)\frac{d}{dx}g(x) \end{array}

 

この形になってることが分かります。

 

\begin{array}{rlc} \displaystyle \frac{d}{dx}(f(x)g(x))&\displaystyle =\left( \frac{d}{dx}f(x) \right) g(x)+f(x)\frac{d}{dx}g(x) \\ \\ \\ \displaystyle \frac{d}{dx} \left( \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right) &\displaystyle =\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime}+\left( \frac{\partial L}{\partial y^{\prime}}\right)\frac{d}{dx}y^{\prime} \end{array}

 

つまり微分の定義を考えると、

→のやつをこのように一つにできそう。

 

 

はい、とまあここまでくれば後は簡単で、

↓のようにすれば、

 

\begin{array}{rlc} \displaystyle \frac{d}{dx}L&\displaystyle =\left( \frac{d}{dx}\left( \frac{\partial L}{\partial y^{\prime}}\right) \right) y^{\prime}+\frac{\partial L}{\partial y^{\prime}}\frac{dy^{\prime}}{dx} \\ \\ &\displaystyle =\frac{d}{dx} \left( \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right) \end{array}

 

\begin{array}{rlc} \displaystyle \frac{d}{dx}L - \frac{d}{dx} \left( \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right)&\displaystyle =0 \\ \\ \displaystyle \frac{d}{dx} \left( L - \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right)&\displaystyle =0 \end{array}

 

微分の位置に気を付けていけば、

このように変形してシンプルにできます。

 

\begin{array}{rlc} \displaystyle \frac{d}{dx} \left( L - \left( \frac{\partial L}{\partial y^{\prime}}\right)y^{\prime} \right)&\displaystyle =0 \\ \\ \displaystyle \frac{d}{dx} \left( L - y^{\prime} \frac{\partial L}{\partial y^{\prime}} \right)&\displaystyle =0 \end{array}

 

で最後、微分して 0 になる条件から、

 

\begin{array}{rlc} \displaystyle \frac{d}{dx} \left( L - y^{\prime} \frac{\partial L}{\partial y^{\prime}} \right)&\displaystyle =0 \\ \\ \\ \displaystyle L - y^{\prime} \frac{\partial L}{\partial y^{\prime}}&=\mathrm{const.} \end{array}

 

この微分される部分が、

「なんらかの定数 \mathrm{const.} 」になることが分かります。

 

\begin{array}{rlc} \displaystyle L - y^{\prime} \frac{\partial L}{\partial y^{\prime}}&=\mathrm{const.} \end{array}

 

これがベルトラミの公式ですね。

主に最速降下曲線の計算で使われます。

 

 

 

 

 

最速降下曲線とベルトラミの公式

 

ここまでくると計算はすごく単純化されてて、

 

\begin{array}{rlc} \displaystyle L(y,y^{\prime})&\displaystyle =\sqrt{\frac{1+(y^{\prime})^2}{2gy}} \\ \\ \displaystyle \frac{\partial }{\partial y^{\prime}}L&\displaystyle =\frac{\partial }{\partial y^{\prime}}\sqrt{\frac{1+(y^{\prime})^2}{2gy}} \\ \\ &\displaystyle =\sqrt{\frac{1}{2gy}} \frac{\partial }{\partial y^{\prime}}\sqrt{1+(y^{\prime})^2} \end{array}

 

これを計算すれば、

 

\begin{array}{rlc} \displaystyle\frac{d}{dx}\sqrt{x}&= \displaystyle \lim_{h→0}\frac{\sqrt{x+h}-\sqrt{x}}{(x+h)-x} \\ \\ &\displaystyle =\lim_{h→0}\frac{\sqrt{x+h}-\sqrt{x}}{h} \left( \frac{\sqrt{x+h}+\sqrt{x}}{\sqrt{x+h}+\sqrt{x}} \right) \\ \\ \\ &\displaystyle =\lim_{h→0}\frac{h}{h(\sqrt{x+h}+\sqrt{x})} \\ \\ &\displaystyle =\lim_{h→0}\frac{1}{\sqrt{x+h}+\sqrt{x}} \\ \\ &\displaystyle =\frac{1}{2\sqrt{x}} \end{array}

 

\begin{array}{rlc} g(x)&=u \\ \\\displaystyle \frac{df(g(x))}{dx}& =\displaystyle \frac{df(u)}{du}\frac{du}{dx} \\ \\ &\displaystyle =\lim_{k→0}\frac{f(u+k)-f(u)}{(u+k)-u} \lim_{h→0}\frac{f(x+h)-f(x)}{(x+h)-x}\end{array}

 

\begin{array}{rlc} \displaystyle \frac{\partial }{\partial y^{\prime}}\sqrt{1+(y^{\prime})^2}&\displaystyle =\frac{1}{2} \left( \sqrt{1+(y^{\prime})^2} \right)^{-\frac{1}{2}} \left(1+(y^{\prime})^2 \right)^{\prime} \\ \\ &\displaystyle =\frac{1}{2}\frac{1}{\sqrt{1+(y^{\prime})^2}}2y^{\prime} \\ \\ &\displaystyle =\frac{y^{\prime}}{\sqrt{1+(y^{\prime})^2}}\end{array}

 

後は定数 c,r を適当に入れれば↓で終わりです。

 

\begin{array}{rlc} \displaystyle L - y^{\prime} \frac{\partial L}{\partial y^{\prime}}&=c \\ \\ \displaystyle \sqrt{\frac{1+(y^{\prime})^2}{2gy}} - y^{\prime}\frac{1}{\sqrt{2gy}}\frac{y^{\prime}}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c \\ \\ \\ \displaystyle \sqrt{1+(y^{\prime})^2} - \frac{(y^{\prime})^2}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \\ \\ \displaystyle \sqrt{1+(y^{\prime})^2}\frac{\sqrt{1+(y^{\prime})^2}}{\sqrt{1+(y^{\prime})^2}} - \frac{(y^{\prime})^2}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \\ \\ \\ \displaystyle \frac{1+(y^{\prime})^2}{\sqrt{1+(y^{\prime})^2}} - \frac{(y^{\prime})^2}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \\ \\ \displaystyle\frac{1}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \end{array}

 

ここまで変形できれば後一息ですね。

 

\begin{array}{rll} \displaystyle\frac{1}{\sqrt{1+(y^{\prime})^2}}&\displaystyle =c\sqrt{2gy} \\ \\ \displaystyle\frac{1}{1+(y^{\prime})^2}&\displaystyle =c^2 2gy \\ \\ \\ \displaystyle \frac{1}{2gc^2}\frac{1}{y}&\displaystyle =1+(y^{\prime})^2 \\ \\ \displaystyle r\frac{1}{y}-1&\displaystyle =(y^{\prime})^2 \end{array}

 

はい。これで答えが出ました。

あっさりし過ぎてますが、これで終わりです。

 

\begin{array}{rlc} \displaystyle y^{\prime} &\displaystyle =\sqrt{\frac{r-y}{y}} \end{array}

 

まあつまり、

重力下における最短経路を表す式は↑になります。

 

 

 

これはサイクロイドの式になるんですけど、

  

\left\{ \begin{array}{rlc} \displaystyle x &=a(θ-\sin θ) \\ \\ y& =a(1-\cos θ) \end{array} \right.

 

それはまた別でやります。

本題から逸れ過ぎるので。

 

 

 

>>続き