カテナリー曲線の変分法による導出【ラグランジュの未定乗数法】【変分法】

以前、カテナリー曲線と呼ばれる重力により形成される曲線について解説しました。（→カテナリー曲線の微分方程式による導出）

カテナリー曲線とは

重力により垂れ下がった紐は、次の関数で表される曲線を描く。

\begin{eqnarray}
y = y_0 + \ff{T_0}{\rho g}\left\{ \cosh \left( \ff{\rho g}{T_0}x \right) \,- 1\right\}\\
\,
\end{eqnarray}

なお、この曲線をカテナリー曲線と呼ぶ。

ただし、$x=0$にて$y=y_0$、糸に働く張力を$T_0$、密度を$\rho$とし、$\cosh t = \DL{\ff{e^{-t} + e^t}{2}}$とする。

静力学的による力の釣り合い式からカテナリー曲線の導出を行いましたが、別の手法によるカテナリー曲線の導出方法を検討します。

今回用いる手法は、変分法とラグランジュの未定乗数法です。

この手法の特徴は、長さに関する束縛条件と、エネルギーに関する条件を用いる点です。

各微小要素に働く力を一切考慮することなく、カテナリー曲線が導出できる点は驚愕に値します。

早速、神秘の世界に分け入っていきましょう。

クリックしてジャンプ

汎関数とは？
1. 合成関数との違い
変分法とは？
1. 変分法と微分の関係
2. オイラー・ラグランジュ方程式
ラグランジュの未定乗数法
変分法によるカテナリー曲線の導出

汎関数とは？

汎関数とは、関数自身を受け取り、それに応じた値を返す関数のことです。

汎関数の例として、次のような定積分を挙げることができます。

\begin{split}
I[f] &= \int_{x_a}^{x_b}f(x) \diff x
\end{split}

具体的には、積分区間を$0$から$\pi$までとして、$f(x)$に$\sin x$を代入すれば$2$となりますが、$x^2$であれば$\DL{\ff{1}{3}\pi^3}$となります。

このように、関数の種類によって、$I$の返す値が変わるような性質を持つ関数を汎関数と呼びます。

このことから、汎関数は関数の関数とも表現されることがあります。

汎関数としては、最も単純な例を挙げましたが、今回の問題では少し複雑な$f\big( x, g(x), h(x)\big)$のような形をした関数を汎関数の計算に用います。

\begin{split}
I[f] &= \int_{x_a}^{x_b}f\big(x, g(x), h(x)\big) \diff x
\end{split}

合成関数との違い

汎関数と似た概念として、合成関数があります。

合成関数と汎関数の違いについて解説します。

まず、関数$f(x)$と$g(x)$があったとして、合成関数は$f\big( g(x)\big)$と表せます。

例えば、$f(x) = x^2, g(x) = \cos x$とすると、その合成関数$f\big( g(x)\big)$は$\cos^2 x$となります。

得られた合成関数は$x=0$のとき$1$となりますが、$\DL{x = \ff{\pi}{2}}$であれば$0$となります。

さて、先ほど考えた汎関数を思い出して、積分区間を$0$から$\pi$とすると、

\begin{split}
I[f] &= \int_{0}^{\pi}\cos^2 x \,\diff x \EE
&= \ff{\pi}{2}
\end{split}

となります。

その計算結果は定数となりますが、$x$に関わらず積分区間と関数によって汎関数の値が決まることが分かります。

以上をまとめると、合成関数は変数が決まると出力される値が決まる一方で、汎関数は関数が決まった時点で変数の値に関係なく決まるという違いがあるのです。

変分法とは？

とある条件の下（長さ一定、エネルギーが最小など）で曲線の形がどのようになるのかを求める手法を変分法と呼びます。

また、このように曲線の形に制限を加える条件を束縛条件と呼びます。

さて、束縛条件を満たす曲線を関数で表すとして、$y = f(x)$と置くことにします。

$x-y$平面上に$x_a$と$x_b$の区間で、曲線を図示すると次のようになります。

さて、$f(x)$を青線で描き、この$f(x)$の曲線に$\delta f(x)$の関数を足すと、赤線のようなグラフとなります。（二つの曲線で端点と終点は一致しているとします）

ここで、先ほどの汎関数の考えを適用しましょう。

それぞれの曲線の定積分を計算すると、汎関数は次のように表すことができます。

$$
\left\{
\begin{split}
&I[f] = \int_{x_a}^{x_b}f(x) \diff x \EE
&I[f]+\delta I[f] = \int_{x_a}^{x_b}\Big( f(x)+\delta f(x) \Big) \diff x
\end{split}
\right.
$$

まず、$f(x)$の曲線では束縛条件を満たしていることが前提となります。

次に、$f(x)$の曲線からわずかに形が変化した$f(x)+\delta f(x)$の曲線も、束縛条件をおおむね満たしていると考えられます。

したがって、二つの曲線の汎関数の間には、

\begin{split}
I &\NEQ I + \delta I
\end{split}

のような関係が成立すると考えられます。（見通しを良くするため、$I[f]$を$I$のように表記します）

ここで重要な発想をします。

$\delta f(x)$の関数による変化がわずかであれば、$\delta I = 0$と見なせるでしょう。

勘の良い方は、微分の極値を求めるときの手法と良く似ていると気付くでしょう。

さて、ある関数$y(x)$の停留値（極小値や極大値など）を求める場合、$\DL{\ff{\diff y}{\diff x}=0}$という条件を課して関数の極値を求めました。

$\delta I = 0$という条件を課すことは、関数の停留値を求める手法と非常に似ています。

すなわち、$\delta I = 0$という条件を課すことは、汎関数の停留値を求める手法となるのです。

なお、$\delta I$は変分と呼ばれ、汎関数の停留値を求める手法を変分法と呼びます。

変分法と微分の関係

さて、物理学においては$f(x, y, y’)$を被積分関数に持つ汎関数が重要になります。

この汎関数を$I[y]$と置くと次のようにできます。

\begin{eqnarray}
I[y] = \int_{x_a}^{x_b} f(x, y, y’) \diff x \tag{1}
\end{eqnarray}

さて、元の関数に対して、わずかな変位を与えた関数$f(x,y+\delta y, y’+\delta y’)$の汎関数を考えると次のように表せます。

\begin{eqnarray}
I[y+\delta y] &=& \int_{x_a}^{x_b}f(x, y+\delta y, y’+\delta y’) \diff x \tag{2} \EE
&=& I[y]+\delta I \EE
\end{eqnarray}

また、$\delta y(x_ay) = \delta y(x_b) = 0$という条件を課します。

変分$\delta I$について調べることがここでの目標になります。

$\delta y(x)$は必ずしも$f(x)$の関数となる訳ではないので、$f(x, y+\diff y, y’+\diff y’)$とは表さず、$f(x, y+\delta y, y’+\delta y’)$としています。

ここで$f(x, y+\delta y, y’+\delta y’)$をテイラー展開すると次のようにできます。

\begin{eqnarray}
f(x, y+\delta y, y’+\delta y’) = f(x, y, y’) + \ff{\del f}{\del y}\delta y + \ff{\del f}{\del y’}\delta y’ \tag{3}
\end{eqnarray}

式(1)～(3)より$\delta I$は、

\begin{eqnarray}
\delta I &=& (I+\delta I) \,- I \EE
&=& \int_{x_a}^{x_b}f(x, y+\delta y, y’+\delta y’) \diff x \,- \int_{x_a}^{x_b} f(x, y, y’) \diff x \EE
&=& \int_{x_a}^{x_b} \left( f(x, y, y’) + \ff{\del f}{\del y}\delta y + \ff{\del f}{\del y’}\delta y’ \,- f(x, y, y’) \right) \diff x \EE
&=& \int_{x_a}^{x_b} \left( \ff{\del f}{\del y}\delta y + \ff{\del f}{\del y’}\delta y’ \right) \diff x \tag{4}
\end{eqnarray}

と計算できます。

オイラー・ラグランジュ方程式

汎関数が停留値となる（つまり、$\delta I = 0$）条件を求めましょう。

まずは式(4)の第二項に関する積分$\DL{\int_{x_a}^{x_b}\ff{\del f}{\del y’}\delta y’ \,\diff x }$について考えます。

$\delta y’ = \DL{\ff{\diff }{\diff x}(\delta y)}$であるので、部分積分を実行すると、

\begin{eqnarray}
\int_{x_a}^{x_b}\ff{\del f}{\del y’}\delta y’ \,\diff x &=& \int_{x_a}^{x_b}\ff{\del f}{\del y’}\left( \ff{\diff }{\diff x} (\delta y)\right) \,\diff x \EE
&=& \left[ \ff{\del f}{\del y’}\delta y \right]_{x_a}^{x_b} \,- \int_{x_a}^{x_b}\ff{\diff}{\diff x}\left( \ff{\del f}{\del y’}\delta y \right) \diff x
\end{eqnarray}

とできて、$\delta y(x_a) = \delta y(x_b) = 0$であるため、

\begin{eqnarray}
\int_{x_a}^{x_b}\ff{\del f}{\del y’}\delta y’ \,\diff x
&=& – \int_{x_a}^{x_b}\ff{\diff}{\diff x}\left( \ff{\del f}{\del y’}\delta y \right) \diff x \tag{5}
\end{eqnarray}

となります。

この結果を改めて式(4)に適用すると、

\begin{eqnarray}
\delta I &=& \int_{x_a}^{x_b} \left( \ff{\del f}{\del y}\delta y + \ff{\del f}{\del y’}\delta y’ \right) \diff x \EE
&=& \int_{x_a}^{x_b} \left\{ \ff{\del f}{\del y} \,- \ff{\diff}{\diff x}\left( \ff{\del f}{\del y’} \right) \right\}\delta y \diff x
\end{eqnarray}

この問題において、$I$が停留値を取るとき、$\delta I = 0$とならなければなりません。

また、あらゆる$\delta y$に対して常に$\delta I = 0$となることを要請すると、

\begin{eqnarray}
\ff{\del f}{\del y} \,- \ff{\diff}{\diff x}\left( \ff{\del f}{\del y’} \right) = 0
\end{eqnarray}

となることが分かります。

この微分方程式は、汎関数が停留値を取るときに必ず成立するため、オイラーの微分方程式または、オイラー・ラグランジュ方程式と呼ばれます。

オイラー・ラグランジュ方程式

どんな$y$ の関数に対しても、汎関数が停留値を持つためには、次のオイラー・ラグランジュ方程式が満たされていなければならない。（つまり、$\delta I = 0$となる条件）

\begin{eqnarray}
\ff{\diff }{\diff x}\left(\ff{\del f}{\del y’}\right)\,- \ff{\del f}{\del y} = 0 \\
\,
\end{eqnarray}

この方程式は解析力学にて中心的な役割を果たす重要な方程式です。

ラグランジュの未定乗数法

カテナリー曲線の導出に必要なもう一つの道具であるラグランジュの未定乗法について解説します。

ラグランジュの未定乗数法とは、ある制約条件（束縛条件）の下で多変数関数の最大値や最小値のような極値を求める手法です。

制約条件を$g(x,y)$として、$f(x,y)$の最大値・最小値を求めたい場合などに用いられます。

例題を確認しましょう。

例題：$g(x,y)=x^2+y^2 \,- 4= 0$のとき、$f(x,y)=3x^2 + 4xy + 3y^2$の最大値と最小値を求めよ。

まず、$\lambda$（ラムダ）なる変数を導入し、次のようなラグランジュ関数$L(x,y,\lambda)$を考えます。

\begin{eqnarray}
L(x,y,\lambda) &=& f(x,y)\,- \lambda g(x,y) \EE
&=& 3x^2 + 4xy + 3y^2 \,- \lambda(x^2+y^2\,- 4)
\end{eqnarray}

それぞれの変数で偏微分し、各式の右辺を$0$と置きます。

\begin{eqnarray}
\ff{\del L}{\del x} &=& (3\,-\lambda)x+2y = 0 \EE
\ff{\del L}{\del y} &=& 2x + (3\,-\lambda) y = 0 \EE
\ff{\del L}{\del \lambda} &=& x^2+y^2\,- 4 = 0 \EE
\end{eqnarray}

上二本の連立方程式を解くために、次の行列式を考え、右辺を$0$と置くと、

\begin{eqnarray}
\begin{vmatrix}
3\,-\lambda & 2 \\
2 & 3\,-\lambda
\end{vmatrix}
&=& 0 \EE
(3\,-\lambda)(3\,-\lambda)\,-4 &=& 0 \EE
(\lambda\,-1)(\lambda\,-5) &=& 0
\end{eqnarray}

とできて、$\lambda = 1, 5$と求められます。

$\lambda = 1$のとき$(x,y)=(\pm \sqrt{2}, \mp \sqrt{2})$であり、$f(x,y)=4$となります。

一方、$\lambda = 5$のとき$(x,y)=(\pm \sqrt{2}, \pm \sqrt{2})$であり、$f(x,y)=20$となります。

さて、${g(x,y)}$は有界集合であり、$f(x,y)$が連続関数であるため、$3x^2 + 4xy + 3y^2$は最大値と最小値を持ちます。

さらに、最小値・最大値は極値でもあることから、上で求めた$4, 20$が当てはまります。

これより、$f(x, y)$の最小値は$4$、最大値は$20$であることが分かります。

このように、制約条件の中である関数の最大値や最小値を求める手法がラグランジュの未定乗数法です。

なお、制約条件が$g(x,y), h(x,y)$の二つになった場合は、次のようなラグランジュ関数を考えれば良く、

\begin{eqnarray}
L(x,y,\lambda,\mu) = f(x,y)\,- \lambda g(x,y)\,- \mu h(x,y)
\end{eqnarray}

この関数を各変数に関して偏微分すれば答えを求められます。

ラグランジュの未定乗数法のポイントは、あえて変数を増やして偏微分により連立方程式を増やし、解けるような形に誘導することです。

変分法によるカテナリー曲線の導出

いよいよ、カテナリー曲線の変分法による導出に取り掛かりましょう。

まず、$x-y$平面上で$x=-a$から$x=a$まで吊り下げ、このときの曲線が$y=f(x)$で表せると仮定します。

このとき、ひもの全長を$L$とすると、

\begin{eqnarray}
G[x,y,y’] = \int_{-a}^{a} \sqrt{1 + y’^2}\,\diff x = L
\end{eqnarray}

と表せます。この条件が束縛条件となります。

次に、ひものポテンシャルエネルギー$V$に関しては、

\begin{eqnarray}
V &=& \int_C (\rho \diff l)gy \EE
F[x,y,y’] &=& \rho g\int_{-a}^{a}y\sqrt{1 + y’^2}\, \,\diff x
\end{eqnarray}

と表せます。ただし、ひもの密度を$\rho$（ロー）、重力加速度を$g$とします。

ひもが静止しているとき、$V$すなわち、$F[x,y,y’] $は最小となります。

以上より、$G[x,y,y’]$という束縛条件の元に、$F[x,y,y’] $が最小となる値を求めるラグランジュの未定乗数法を利用できることに気が付きます。

そこで、$\lambda$を変数として、$H[x,y,y’,\lambda]$という新たな汎関数を置くことができます。

\begin{eqnarray}
H[x,y,y’,\lambda] &=& F[x,y,y’]\,- \lambda G[x,y,y’] \EE
&=& \int_{-a}^{a}h(x,y,y’,\lambda) \tag{6}
\end{eqnarray}

先ほどの例題では偏微分により変数を消しに行きましたが、汎関数では微分は使えないため、代わりに変分法を適用します。

この汎関数が停留値を取るポイントを探せば良く、オイラー・ラグランジュ方程式より、

\begin{eqnarray}
\ff{\diff }{\diff x}\left(\ff{\del h}{\del y’}\right)\,- \ff{\del h}{\del y} = 0 \\
\,
\end{eqnarray}

となれば良いことが分かります。

簡単のため、$\rho g = 1$とすると、今、$h(x,y,y’,\lambda) = (y\,-\lambda)\sqrt{1 + y’^2}$なので、オイラー・ラグランジュ方程式を計算すると、

\begin{eqnarray}
y’^2(1+y’^2)+(y\,-\lambda)y^{”}\,-(1+y’)^2= 0 \tag{7}
\end{eqnarray}

となります。

ここで、$Y=y’=\DL{\ff{\diff y}{\diff x}}$とおくと、$y^{”}=\DL{ \ff{\diff}{\diff x}\ff{\diff y}{\diff x}= \left( \ff{\diff y}{\diff x}\ff{\diff }{\diff y} \right)\ff{\diff y}{\diff x} =Y\ff{\diff Y}{\diff y} }$となるので、

式(7)は、

\begin{split}
&Y^2(1+Y^2)+(y\,-\lambda)Y\ff{\diff Y}{\diff y}\,-(1+Y)^2 = 0 \EE
&\therefore \, (y\,-\lambda)Y\ff{\diff Y}{\diff y} = 1+Y^2
\end{split}

と整理できます。

これより

\begin{split}
\ff{Y}{1+Y^2}\diff Y = \ff{\diff y}{y+\lambda}
\end{split}

として、両辺を積分すると、

\begin{split}
\ln |y+\lambda| = \ff{1}{2}\ln (1+Y^2) + C
\end{split}

となります。なお、$C$を積分定数とします。

したがって、

\begin{split}
y+\lambda = C\sqrt{1+Y^2}
\end{split}

となり、両辺を二乗した後、平方根を取ると、

\begin{split}
Y = \ff{\diff y}{\diff x} = \pm \sqrt{\left( \ff{y+\lambda}{C} \right)^2 \,-1 }
\end{split}

となります。

さて、$u=\DL{\ff{y+\lambda}{C}}$とすると、