高低差のある二点間$A, B$をつなげてコースを作ったとします。
このコースに沿ってボールを転がしたとき、最も速く$B$点にたどり着くコースはどんな形状でしょうか?
このように、高低差のある二点間 をつなげたコースの中で最も速くゴールにたどり着く曲線のことを最速降下曲線と呼びます。
今回は最速降下曲線の導出とこの過程で解析力学の輪郭が立ち現れる神秘を見ていきましょう。
ヨハン・ベルヌーイの問い
1696年、ヨハン・ベルヌーイが「二点間をつなぐコースの中で、ゴールまで最も速くたどり着くのはどんな曲線か?」という問いを学者たちに投げかけました。
直観的には、二点間を直線でつないだコースが最も速くゴールまでたどり着くように思えますがどうなるのでしょうか?
実際に計算していきましょう。
また、この問題を考えるにあたり、いきなり最速降下曲線を決めることは無理そうです。
そこで、曲線を無数の微小区間に分割し、それぞれの微小区間での降下時間を足し合わせて降下時間が最小になる条件を考えます。
微分積分を活用して最速降下曲線を求める方針で攻略していきます。
降下時間の計算
コースの曲線を $y = F(x)$とし、この微小区間の長さを$\diff s$とします。
この微小な曲線は十分短いため直線と考えて良いでしょう。図で表すと下のようになります。
小球の質量を$m$、重力加速度を$g$とします。
まずは、区間$\diff s$をボールが通過する時間$\diff t$ を計算しましょう。
原点$O$において速度が$0$とすると、$y$ だけ下った点での速度$v$ は次のように計算できます。
速度はコースの形状には無関係に、原点からの垂直方向の距離のみによって決まることに注目してください。
\begin{eqnarray}
mgy &=& \frac{1}{2}mv^2 \EE
\therefore\,\,\, v &=& \sqrt{2gy} = \sqrt{2gF(x)}
\end{eqnarray}
ここで、$\DL{\diff y = \frac{\diff y}{\diff x}\cdot{\diff x} = F'(x)\diff x }$となることに注意すると、$\diff s$は次のようになります。
$$ \diff s = \sqrt{\diff y^2 + \diff x^2} = \sqrt{F'(x)^2 + 1}\cdot{\diff x} $$
$v\diff t = \diff s$の関係から、微小区間を通過する時間$\diff t$は次のように表せます。
$$ \diff t = \sqrt{ \frac{ F'(x)^2 + 1}{ 2gF(x) } }\diff x $$
これを積分することで、経路全体を通過する時間$I$ が計算できそうです。
$B$点の$x$座標を$X$とすると、$I$ はこのように計算できます。
$$ I = \int_0^{X} \sqrt{ \frac{ F'(x)^2 + 1 }{ 2gF(x) } }\diff x \tag{1} $$
最速降下時間をどう求める?
先述のように、ある関数$y=F(x)$ を決めると、式(1)からコースを通過する時間$I$ が計算できます。
では、無数にある関数の中から$I$ が最小となる関数を求めるにはどうすれば良いのでしょうか?
高校数学の文脈で考えると、『$I$ の最小値を求めよ』という今の問題は、$I$ の表式を微分して極小値や変曲点を計算することに帰着できれば求められそうです。
しかし、$I$は$x$ のみで表されるのではなく、関数$F(x), F'(x)$でも表されています。
つまり、$I$は関数で構成された関数なのです。(明示的に表現すると$I(F(x), F'(x), x)$となります)
ここで問題が起きます。
確かに$F(x)$を決めれば式(1)は$x$で微分できます。けれど、$F(x)$の候補となる関数はそれこそ無限にあります。
$I$を何でどう微分すれば、$I$を最小にする$F(x)$ が見つけられるのでしょうか?
変分原理
ところで、数学的には$I$のことを汎関数と呼びます。
そして、汎関数$I$の微小な変化分を微分ではなく変分と呼び、これを$\delta I$と表します。
微分をすることは難しそうなので、発想を変えてみましょう。
$I$が最小値になる$F(x)$を計算するのではなく、$I$の最小値を与える$F_0(x)$が分かっているとしましょう。(この$F_0(x)$こそ求めたい最速降下曲線です)
ここで、$F_0(x)$を少し削るなり肉付けをした曲線を $F_0(x) + \delta(x)$とします。
ただし、スタートとゴールの位置は変えず$\delta(A) = 0, \delta(B) = 0$とします。
なお、$\delta(x)$も関数となることに注意してください。
関数(コース)の形が変わったことにより、コースを通過する時間も変わります。この時間を$I+\delta I$とします。
さて、$\delta(x)$はごくごくわずかな変化なので、$F_0(x)$と$F_0(x) + \delta(x)$の形状にほとんど違いはありません。
さらに、$F_0(x)$では$I$が最小値であるため、$F_0(x)+\delta(x)$となっても劇的に$I$が変化することはないでしょう。
ですから、次のような近似が成り立つはずです。
$$ I + \delta I \fallingdotseq I $$
さて、$ \delta(x) $の変化を極限まで小さくすると、通過時間$ I + \delta I $は$I$と同じになるはずです。
つまり、次のような等式が成り立つはずです。
これを変分原理と呼びます。
変分原理から,いよいよ最速降下曲線に迫っていきましょう。
オイラーの方程式
変分原理を使うと以下の式が成立します。($ y = F(x), \delta y = \delta (x) $)
\begin{eqnarray}
&\delta I = \int_A^B G(y+\delta y, y’+\delta y’, x) \diff x- \int_A^B G(y, y’, x) \diff x = 0 \\
\end{eqnarray}
ただし、
\begin{eqnarray}
G(y, y’, x) = \sqrt{ \frac{ y’^2 + 1 }{ 2gy } }
\end{eqnarray}
また、積分区間$A, B$は点$A$と点$B$の$x$座標を表すものとします。
積分区間が同じなので、
$$ \delta I = \int_A^B \Big\{ G( y+\delta y, F'(x)+\delta y’, x )- G( y, y’, x) \Big\} \diff x = 0 \tag{2} $$
と整理できます。
さて、積分の中括弧の中身は全微分の要領から次のように表せます。
\begin{eqnarray}
\delta G &=& G( y+\delta y, y’+\delta y’, x’)- G(y, y’, x) \EE
&=& \frac{\partial G}{\partial y}\delta y + \frac{\partial G}{\partial y’}\delta y’
\end{eqnarray}
この結果を使い、式(2)は以下のように変形できます。
\begin{eqnarray}
\delta I &=& \int_A^B \left(\frac{\partial G}{\partial y}\delta y + \frac{\partial G}{\partial y’}\delta y’ \right)\diff x \EE
&=& \int_A^B \frac{\partial G}{\partial y}\delta y dx + \int_A^B \frac{\partial G}{\partial y’}\delta y’ \diff x \EE
&=& \int_A^B \frac{\partial G}{\partial y}\delta y dx + \int_A^B \frac{\partial G}{\partial y’}\frac{d}{dx}(\delta y) \diff x
\end{eqnarray}
さらに、右辺第二項に対して部分積分を実行すると、
\begin{eqnarray}
\delta I &=& \int_A^B \frac{\partial G}{\partial y}\delta y + \left[ \frac{\partial G}{\partial y} \delta y \right]_A^B – \int_A^B \frac{\diff}{\diff x}\left( \frac{\partial G}{\partial y’} \right) \delta y \diff x \EE
&=& \int_A^B \left\{ \frac{\partial G}{\partial y}- \frac{\diff}{\diff x}\left( \frac{\partial G}{\partial y’} \right) \right\}\delta y \diff x + \left[ \frac{\partial G}{\partial y’} \delta y \right]_A^B \EE
\end{eqnarray}
となります。
ここで、スタートとゴールでは$\delta y(A) = 0$,$\delta y(B) = 0$ なので、右辺第二項の計算結果は$0$になります。
すなわち、
\begin{eqnarray}
\left[ \frac{\partial G}{\partial y’} \delta y \right]_A^B &=& \frac{\partial G}{\partial y’} \Big\{ \delta y(A)\,-\delta y(B) \Big\} \EE
&=& 0
\end{eqnarray}
です。
従って$\delta I$の計算結果は次のようになります。
$$ \delta I = \int_A^B \left\{ \frac{\partial G}{\partial y}- \frac{\diff}{\diff x}\left( \frac{\partial G}{\partial y’} \right) \right\}\delta y \diff x = 0 \tag{3} $$
式(3)の$\delta y$に関して、$A<x<B$の範囲では(微小な)任意の値を値を取れます。
そのため、式(3)が恒等的に$0$となるために,
$$ \frac{\partial G}{\partial y}- \frac{\diff}{\diff x}\left( \frac{\partial G}{\partial y’} \right) = 0 $$
とならなければなりません。
移行して形を整えるとこのようになります。
この方程式をオイラーの方程式と呼びます。
では、オイラーの方程式から最速降下曲線を計算してみましょう。
最速降下曲線
いよいよ最速降下曲線を求めていきましょう。($2g$などの定数は$1$とて扱います。)
$$ G = \sqrt{\frac{1+y’^2}{y}} $$
これをオイラーの方程式に代入して整理すると、
\begin{eqnarray}
\frac{y^{”}}{1+y’^2} + \frac{1}{y} = 0
\end{eqnarray}
となり、$y’$を掛けて積分を行い $y$ について整理すると、
\begin{split}
\int \frac{y^{”}y’}{1+y’^2} dx + \int \frac{y’}{y} dx &= 0 \EE
\log(1+y’^2) + \log y &= C \EE
(1+y’^2)y &= C_1 \EE
\therefore\,\,\, y’ = \frac{\diff y}{\diff x} = \pm &\sqrt{\frac{C_1-y}{y}}
\end{split}
となります。
とりあえず負の場合について考えるとして、$ \DL{y=\frac{C_1}{2}(1+\cos \theta)} $ とします。
すると、$ \DL{\diff y = -\frac{C_1}{2}\sin \theta \diff \q}$ とできます。
上の式を変形して整理すると、
\begin{eqnarray}
\diff x &=& -\sqrt{ \frac{y}{C_1-y} } \diff y \EE
&=& \frac{C_1}{2}\sqrt{\frac{1+\cos \theta}{1-\cos \theta} } \sin \theta \diff \q \EE
&=& \frac{C_1}{2} (1+\cos \theta) \diff\q
\end{eqnarray}
両辺を積分することで,
\begin{eqnarray}
\int x &=& \frac{C_1}{2} (1+\cos \theta) \diff\q \EE
x &=& \frac{C_1}{2} (\theta + \sin \theta)
\end{eqnarray}
となります。ただし,$\theta = 0$にて$x=0$としています。
以上をまとめると、$x, y$ は$\theta$ を媒介変数として次のように表せます。
\begin{eqnarray}
x &=& a(\theta + \sin \theta) \EE
y &=& a(1+\cos \theta) ,\qquad \left(a = \frac{C_1}{2}\right)
\end{eqnarray}
これこそ求めたかった最速降下曲線です。
この曲線をサイクロイドと呼び,$-\pi \leq \theta \leq \pi $ の範囲で表すと次のようになります。
サイクロイドと物体の降下速度の関係には面白い関係があります。
その紹介は別の記事でします。
解析力学へ
最速降下曲線は変分原理に基づいたオイラーの方程式から導出でき、
その最速降下曲線はサイクロイドであることが分かりました。
さて、オイラーの方程式ですが$x$を$t$、$y$を$q$、$G$を$L$と読み替えてみましょう。
すると、
となります。
これ自体は変数を単に変えただけですが、これはオイラー・ラグランジュ方程式と呼ばれる方程式と同一の形式になっています。
これは偶然ではなく、力学でも変分原理に対応するダランベールの原理というものがあり、この原理からオイラー・ラグランジュ方程式が導かれるためです。
オイラー・ラグランジュ方程式は解析力学の基礎を形成し、解析力学は統計力学や量子力学に繋がっていきます。
ダランベールの原理からオイラー・ラグランジュ方程式を導出する過程は別の記事で解説します。
物理学にはダランベールの原理と関連して最小作用の原理と呼ばれる概念があります。最小作用の原理が見いだされる過程は活力論争と呼ばれる歴史的な論争と関連しています。なかなか興味深いのでどこかで紹介したいと思います。