ラグランジュの未定乗数法とは?|理論と具体例

スポンサーリンク
ホーム » 物理数学 » ラグランジュの未定乗数法とは?|理論と具体例

ラグランジュの未定乗数法と呼ばれる手法は、ある制約条件の下で対象の関数の極値を求める手法のことです。

物理学の世界では、エネルギーなどの物理量は関数として表現されます。そして、その関数の極値は基本的に最大値または最小値となります。

解析力学ではこのような性質を利用し、ホロノミックな束縛を受けている系の状態をラグランジュの未定乗数法により決定することができるようになります。

ラグランジュの未定乗数法

$n$ 変数関数 $f$ は有界かつ連続、$g1,\cdots,g_m$ を $C^1$ 級(微分可能かつ$g’$ が連続)の $n$ 変数関数とする。

このとき、$g_1=\cdots=g_m=0$ という制約の下で $f$ が極値を取る点は、以下で定義される関数 $L$ が

\begin{split}
L=f-\sum_{j=1}^m\lambda_j\,g_j
\end{split}

次の条件を満たすような点と一致する。ただし、$\lambda$(ラムダ)を任意の定数とする。

\begin{split}
\ff{\del L}{\del x_1}=\cdots=\ff{\del L}{\del x_n}=0 \\
\,
\end{split}

今回はラグランジュの未定乗数法の具体例とその証明について解説していきます。

スポンサーリンク

ラグランジュの未定乗数法の例題

ラグランジュの未定乗数法とは、ある制約条件(束縛条件) $g(x,y)$ の下で、多変数関数 $f$ の極値を求める手法です。関数が単調増加であることが明らかな場合、この極値が最大値あるいは最小値であると判断できます。

ラグランジュの未定乗数法の理論的背景を説明する前に、具体例について見ていきます。

例題:$\DL{ g(x,y)=\ff{x^2}{a^2}+\ff{y^2}{b^2}-1=0}$ のとき、$f(x,y)=4xy$ の最大値を求めよ。

これは楕円に内接する四角形の内、面積が最大となるものを求める問題に相当します。

まず、$\lambda$(ラムダ)なる変数を導入し、次のようなラグランジュ関数 $L(x,y,\lambda)$ を設定します。

\begin{eqnarray}
L(x,y,\lambda) &=& f(x,y)\,- \lambda\,g(x,y) \EE
&=& 4xy-\lambda\left(\ff{x^2}{a^2}+\ff{y^2}{b^2}-1\right)
\end{eqnarray}

上式をそれぞれ $x,y$ で偏微分し、そして各式の右辺を $0$ と置きます。

\begin{eqnarray}
\ff{\del L}{\del x} &=& 4y-\ff{2\lambda x}{a^2} = 0 \EE
\ff{\del L}{\del y} &=& 4x-\ff{2\lambda y}{b^2} = 0
\end{eqnarray}

次の行列式を計算することで上の連立方程式の解が得られます。

\begin{split}
0&=
\begin{vmatrix}
\DL{-\ff{2\lambda}{a^2}} & 4 \\
4 & \DL{-\ff{2\lambda}{b^2}}
\end{vmatrix} \EE
0&=\ff{4}{a^2b^2}\lambda^2-16\EE
&\quad\therefore\,\lambda = \pm2ab
\end{split}

$\lambda=2ab$ のとき $(x,y)=\left(\DL{\ff{a}{\sqrt{2}},\ff{b}{\sqrt{2}}}\right)$ であり、$f(x,y)=2ab$ となります。

さて、${g(x,y)}$ は有界集合であり、$f(x,y)$ が連続関数であることから、ラグランジュの未定乗数法より $f(x,y)=4xy$ は $\lambda=\pm2ab$ にて極値となると言えます。そして、極値は同時に最小値・最大値となります。

最小値が $0$ であることは明らかなので、上で求めた $2ab$ が最大値であることが分かります。したがって、楕円に内接する長方形の内、その最大値が $2ab$ となると言えます。

このように、制約条件の中である関数の最大値や最小値を求める手法がラグランジュの未定乗数法となります。

なお、制約条件が $g_1(x,y), g_2(x,y)$ など複数になった場合は、次のようなラグランジュ関数を考えれば良く、

\begin{eqnarray}
L(x,y,\lambda_1,\lambda_2) = f(x,y)\,- \lambda_1\,g_1(x,y)\,- \lambda_2\,g_2(x,y)
\end{eqnarray}

この関数を各変数に関して偏微分すれば極値を求められます。

スポンサーリンク

ラグランジュの未定乗数法の数学的な背景

上の例題から分かるように、あえて変数を増やすことがラグランジュの未定乗数法の特徴になります。そして、これを偏微分により連立方程式の形に誘導することがポイントとなります。

例題の手法が一般の場合に通用できることを説明していきます。

ある関数 $f(x_1,\cdots,x_n)$ に最大値と最小値があったとします。最大値や最小値は $f$ の極値でもあることに注目すると、全ての $i$ に対して、

\begin{eqnarray}
\ff{\del f}{\del x_i}=0
\end{eqnarray}

が成立します。ただし、上の条件は全ての $x$ が独立変数である場合に限って成立することに注意が必要です。

さて、ここで $1$ つの制約条件 $g_1(x_1,\cdots,x_n)=0$ が加わったとします。これは、独立変数が $1$ つ減ることを意味します。制約条件が簡単であれば問題はありませんが、今回はそうでないパターンについて考えます。

さて、極値の近傍では $\diff f=0$ かつ、$\diff g=0$ と言えます。このような性質があるので、任意の定数 $\lambda_1$ を導入しても、

\begin{eqnarray}
\diff f-\lambda_1 \diff g_1=0
\end{eqnarray}

という式が成立することが言えます。これを書き下すと次のようになります。

\begin{eqnarray}
\sum_{i=1}^n\left(\ff{\del f}{\del x_i}-\lambda_1\ff{\del g}{\del x_i}\right)\delta x_i=0
\end{eqnarray}

上の式が全ての $\delta x_i$ に対して恒等的に成立するため、以下の連立方程式が得られます。

$$
\left\{
\begin{split}
\ff{\del f}{\del x_1}-\lambda_1\ff{\del g}{\del x_1}&=0 \EE
\ff{\del f}{\del x_2}-\lambda_1\ff{\del g}{\del x_2}&=0 \EE
\vdots\qquad\quad&\,\EE
\ff{\del f}{\del x_n}-\lambda_1\ff{\del g}{\del x_n}&=0
\end{split}
\right.
$$

一連の連立方程式の注目すべき点は、拘束条件が既に取り込まれていることと、 $\lambda_1$ という独立変数を導入したことで、トータルの独立変数の数が $n$ になっている点です。

したがって、このような新たなラグランジュ関数を導入する動機が生まれる訳です。

\begin{split}
L=f-\lambda_1g_1
\end{split}

新たなラグランジュ関数にはもはや拘束条件は無く、そして $n$ 個の独立変数を持っています。

さて、この $L$ に対して改めて極値を考えると、全ての $i$ に対して以下の方程式が成立すると言えます。

\begin{split}
\ff{\del L}{\del x_i}=0
\end{split}

極値は必ずしも最大値や最小値になる訳ではありませんが、『$f$ が有界かつ連続関数であれば、必ず最大値と最小値を持つ』という定理と合わせて考えることで、上の極値が最大値か最小値に対応することが言えます。

なお、束縛条件が複数存在したとしても同様の議論を適用できます。すなわち、この場合はラグランジュ関数として、

\begin{split}
L=f-\sum_{j=1}^m\lambda_jg_j
\end{split}

の極値を考えれば良いと言えます。

ラグランジュの未定乗数法と解析力学

ラグランジュの未定乗数法は未知数を決定するための手法です。物理学での応用先として解析力学があります。

例えば、$n$ 個の物体が $m$ 個のホロノミックな束縛を受けているときの状態を計算する際、ラグランジュの未定乗数法が使われます。

詳しいことについては別の機会に解説しますが、ラグランジアンなどの物理量が関数として表現できることに深い関わりを持っています。

タイトルとURLをコピーしました