(15) 變分條件 ─ Lagragian Multiplier

April 27, 2024

現在有一個簡單且基本的微積分問題：

找一個點$\vec{q}\in\mathbb{R}^N$，使得 $G(\vec{q})$ 為極值，並限制 $\vec{q}$ 滿足條件$H(\vec{q})=0$。

一般來說找極值，就是對每個維度$(q_1\cdots{q_N})$作微分，找到都為零的就是極值，但因為現在有限制條件，所以不能這樣直接做，要再換個方法。

Let’s go！

解有限制條件的極值問題

假設$\vec{q^*}$為極值的點，$d\vec{q}$為微小的偏移量，因為限制條件恆成立，所以必定滿足

\[H(\vec{q^*}+d\vec{q})-H(\vec{q^*})=0\\ \Rightarrow d\vec{q}\cdot\nabla{H^*}=0\]

再來因為本身不會有任何增減量才會是極值，所以

\[G(\vec{q^*}+d\vec{q})-G(\vec{q^*})=0\\ \Rightarrow d\vec{q}\cdot\nabla{G^*}=0\]

結合以上兩種，從幾何角度上來看，代表對所有$d\vec{q}$會滿足

\[d\vec{q}\perp\nabla{H^*} (\text{ some vector in }\mathbb{R}^N)\nonumber\\ d\vec{q}\perp\nabla{G^*} (\text{ some vector in }\mathbb{R}^N)\nonumber\\\]

兩者成正比關係

\[\nabla{G^*}\propto\nabla{H^*}\nonumber\\ \nabla{G^*} - \lambda\nabla{H^*} = 0\]

這個$\lambda$，我們就稱為 undetermined multiplier。

若找到的$\vec{q}$不滿足$\nabla G^* - \lambda\nabla H^* $ 則$\vec{q}$點就不會是極值。

Euler-Lagrange Equation with Constraints

現在我們把這個限制條件套回Euler-Lagrange Equation，但在此之前，一樣先問個簡單的問題：

若知

\[\int_{0}^{T}\vec{g}(t)\cdot\delta\vec{q}(t)\,dt=0\]

且變化量$\delta{q}(t)$有限制條件

\[\int_{0}^{T}\vec{h}(t)\cdot\delta\vec{q}(t)\,dt=0?\]

要怎麼求這裡的$\vec{g}$？

Note：
感覺是不是和之前推導Euler-Lagrange Equation很像？從求$L$的極值出發 $$ 0=\delta\int L(q,\dot{q},t)\,dt=\int_{0}^{T}\left(\frac{\partial L}{\partial q^*}-\frac{d}{dt}\left(\frac{\partial L}{\partial \dot{q}^*}\right)\right)\delta{q}\,dt $$

不過我們先撇開不談，回到原本問題，若知道兩個函數$\vec{u}(t)$和$\vec{v}(t)$內積可以表示

\[{\left\langle \vec{u} \; \vert \; \vec{v} \right\rangle}\equiv\int_{0}^{T}\vec{u}(t)\cdot\vec{v}(t)\, dt\]

(這裡算是mixed的內積，把finite component space和函數無限維的積分一起看。)

所以最前面的問題就變成是

\[\left\{ \begin{array}{ll} {\left\langle \vec{g} \; \vert \; \delta\vec{q} \right\rangle}=0\\ {\left\langle \vec{h} \; \vert \; \delta\vec{q} \right\rangle}=0 \end{array} \right.\]

得

\[\vec{g}{\quad\mathbin{\!/\mkern-5mu/\!}\quad}\vec{h}\]

再結合本文最前面的undetermined multiplier，就可以寫成

\[\vec{g}-\lambda\vec{h} =0\]

若有多條限制

\[\left\{ \begin{array}{ll} \int_{0}^{T}\vec{h}^{(1)}\cdot\delta\vec{q}\,dt=0\\ \int_{0}^{T}\vec{h}^{(2)}\cdot\delta\vec{q}\,dt=0\\ \vdots\\ \int_{0}^{T}\vec{h}^{(n)}\cdot\delta\vec{q}\,dt=0 \end{array} \right.\]

內積幾何上就是

\[\left\{ \begin{array}{ll} {\left\langle \vec{h}^{(1)} \; \vert \; \delta\vec{q} \right\rangle}=0\\ {\left\langle \vec{h}^{(2)} \; \vert \; \delta\vec{q} \right\rangle}=0\\ \vdots\\ {\left\langle \vec{h}^{(n)} \; \vert \; \delta\vec{q} \right\rangle}=0 \end{array} \right.\]

總結在一起就是

\[\vec{g}-\lambda_1\vec{h}^{(1)} - \lambda_2\vec{h}^{(2)} - \cdots - \lambda_n\vec{h}^{(n)} =0\]

移項得解答

\[\vec{g} = \lambda_1\vec{h}^{(1)} + \lambda_2\vec{h}^{(2)} + \cdots + \lambda_n\vec{h}^{(n)}\]

落在被限制過的組合空間裡。

進一步看限制條件

不過我們說有多個限制條件是什麼意思？實際上當碰到限制條件

\[\vec{f}(t)\cdot\delta\vec{q}(t)=0 \text{ for all } t \in [0,T]\]

其實就隱含了無限多個條件(看時間怎麼切割)，因為任何時刻的條件都要符合。

我們可以借用Dirac’s delta表示法

\[\int_{0}^{T}\delta(t-\tau)\vec{f}(\tau)\cdot\delta\vec{q}(\tau)\, d\tau=\vec{f}(t)\cdot\delta\vec{q}(t)=0\]

這樣t只是一個label of imposed constraints，可以是任意數值落在$[0,T]$的區間。

所以一樣，我們現在維持

\[{\left\langle \vec{g} \; \vert \; \delta\vec{q} \right\rangle}=0\]

$\delta\vec{q}$需要滿足的限制條件為

\[\int_{0}^{T}\left(\delta(t-\tau)\vec{f}(\tau)\cdot\delta\vec{q}(\tau)d\tau\right)=0\\ {\left\langle \delta(t-\tau)\vec{f} \; \vert \; \delta\vec{q}\right\rangle}=0\]

所以解就是

\[\vec{g}-\int_{0}^{T}\lambda_t\delta(t-\tau)\vec{f}(\tau)d\tau=0\\ \Rightarrow\vec{g}-\lambda_t\vec{f}(t) = 0\]

$\lambda_t$現在就是跟$t$有關的函數了！

最後回到我們的Euler-Lagrange Equation

當要求$L(q,\dot{q},t)$極值，並且限定於條件

\[\begin{gather*} f_1(\vec{q})\delta{q_1}+f_2(\vec{q})\delta{q_2}+\cdots+f_n(\vec{q})\delta{q_n}\equiv\vec{f}\cdot\delta{q}=0\\ q\equiv(q_1,q_2,\cdots,q_n)\equiv\vec{q} \end{gather*}\]

真正的解$ q^* $就會滿足

\[\diff{}{t}\pdv{L}{\dot{\vec{q}}^*}-\pdv{L}{\vec{q}^*}-\lambda(t)\vec{f}(\vec{q}^*)=0\\ \Rightarrow\diff{}{t}\pdv{L}{\dot{\vec{q}}^*}=\pdv{L}{\vec{q}^*}-\lambda(t)\vec{f}\]

就是Euler-Lagrange equation with constraint。

附註說明一下，這裡的右邊第一項就是我們熟知的作用力，第二項會稱為generalized constraint force。

Cjue25

(15) 變分條件 ─ Lagragian Multiplier

解有限制條件的極值問題

Euler-Lagrange Equation with Constraints

進一步看限制條件

You may also enjoy

(11) 熱力 ─ 補充

(10) 熱力 ─ Thermal & Information Entropy

(9) 熱力 ─ 資訊熵 with Shannon Entropy

(8) 熱力 ─ 系統不確定性 & 氣體動力論