Równania Eulera-Lagrange’a , równania Lagrange’a – równania cząstkowe drugiego rzędu, których rozwiązaniami są funkcje, dla których funkcjonał (zadany całką oznaczoną ) jest stacjonarny . Stanowią podstawowe równania rachunku wariacyjnego .
Np. dla funkcjonału
S
{\displaystyle S}
zależnego od funkcji jednej zmiennej
x
(
t
)
{\displaystyle x(t)}
i jej pierwszej pochodnej
x
′
(
t
)
{\displaystyle x'(t)}
S
=
∫
t
1
t
2
L
(
x
(
t
)
,
x
′
(
t
)
,
t
)
d
t
{\displaystyle S=\int \limits _{t_{1}}^{t_{2}}L(x(t),x'(t),t)dt}
równania Eulera-Lagrange’a przyjmują postać[1] :
d
d
t
(
∂
L
∂
x
′
)
−
∂
L
∂
x
=
0.
{\displaystyle {\frac {d}{dt}}\left({\frac {\partial L}{\partial x'}}\right)-{\frac {\partial L}{\partial x}}=0.}
Rozwiązaniami tego równania są funkcje
x
(
t
)
,
{\displaystyle x(t),}
dla których
S
{\displaystyle S}
jest stacjonarne, tj. dla funkcji
x
o
d
c
h
(
t
)
{\displaystyle x_{odch}(t)}
niewiele odchylającej się od funkcji optymalnej
x
(
t
)
{\displaystyle x(t)}
wartość funkcjonału
S
{\displaystyle S}
zmienia się nieznacznie. Jest to warunkiem koniecznym, żeby
S
{\displaystyle S}
przyjmowało dla
x
(
t
)
{\displaystyle x(t)}
ekstremum .
Postać równań Eulera-Lagrange’a w ogólniejszych przypadkach (wiele funkcji, wiele zmiennych, pochodne wyższych rzędów) omówiono w dalszych rozdziałach artykułu.
Równanie Eulera-Lagrange’a zostało wprowadzone przez Leonharda Eulera i Josepha Louisa Lagrange’a w latach 1750 podczas prac związanych z problemem tautochrony .
Lagrange znalazł rozwiązanie tego problemu w 1755 i przesłał je Eulerowi. Obaj rozwijali dalej tę metodę i zastosowali ją w mechanice, co doprowadziło do sformułowania mechaniki lagranżowskiej. Dzięki ich współpracy powstał rachunek wariacyjny (nazwę tę wymyślił Euler w 1766)[2] .
Równania Eulera-Lagrange’a stosuje się w rachunku wariacyjnym, na przykład szukając najkrótszej drogi (geodezyjnej ), biegu promienia światła, czyli linii, dla której droga optyczna jest najkrótsza (zasada Fermata ) albo do minimalizacji energii potencjalnej układu (np. krzywa łańcuchowa ).
Zgodnie z zasadą Hamiltona układ fizyczny porusza się po takiej trajektorii, że działanie
S
{\displaystyle S}
obliczone dla ruchu od chwili
t
=
t
1
{\displaystyle t=t_{1}}
do chwili
t
=
t
2
{\displaystyle t=t_{2}}
jest stacjonarne, przy czym
S
=
∫
t
1
t
2
L
d
t
,
{\displaystyle S=\int \limits _{t_{1}}^{t_{2}}Ldt,}
gdzie:
t
{\displaystyle t}
– czas,
L
{\displaystyle L}
– lagrangian .
W mechanice klasycznej lagrangian ma postać:
L
=
E
k
i
n
−
E
p
o
t
,
{\displaystyle L=E_{kin}-E_{pot},}
gdzie:
E
k
i
n
{\displaystyle E_{kin}}
– energia kinetyczna układu,
E
p
o
t
{\displaystyle E_{pot}}
– energia potencjalna układu.
Aby
S
{\displaystyle S}
było stacjonarne,
L
{\displaystyle L}
musi spełniać równanie Eulera-Lagrange’a dla każdej zmiennej stanu
q
k
(
t
)
:
{\displaystyle q_{k}(t){:}}
d
d
t
(
∂
L
∂
q
k
˙
)
−
∂
L
∂
q
k
=
0
,
{\displaystyle {\frac {d}{dt}}\left({\frac {\partial L}{\partial {\dot {q_{k}}}}}\right)-{\frac {\partial L}{\partial q_{k}}}=0,}
gdzie:
q
k
˙
=
d
q
k
d
t
.
{\displaystyle {\dot {q_{k}}}={\frac {dq_{k}}{dt}}.}
Wyrażenia występujące w równaniach Eulera-Lagrange’a mają swoje nazwy:
∂
L
∂
q
k
=
F
k
{\displaystyle {\frac {\partial L}{\partial q_{k}}}=F_{k}}
– siła uogólniona (jej
k
{\displaystyle k}
-ta składowa),
∂
L
∂
q
˙
k
=
p
k
{\displaystyle {\frac {\partial L}{\partial {\dot {q}}_{k}}}=p_{k}}
– pęd uogólniony (jego
k
{\displaystyle k}
-ta składowa).
Przykład: Maszyna Atwooda
edytuj
Maszyna Atwooda.
x
1
{\displaystyle x_{1}}
i
x
2
{\displaystyle x_{2}}
to odległości ciał o masach odpowiednio
m
1
{\displaystyle m_{1}}
i
m
2
{\displaystyle m_{2}}
od poziomu osi krążka. Do opisu układu potrzebne są dwie współrzędne stanu (
x
1
{\displaystyle x_{1}}
i
x
2
{\displaystyle x_{2}}
).
Mamy układ dwóch mas
m
1
{\displaystyle m_{1}}
m
2
{\displaystyle m_{2}}
w stałym polu grawitacyjnym
g
→
{\displaystyle {\vec {g}}}
przewieszonych przez nieważki krążek. Linka, na której wiszą również jest nieważka i nierozciągliwa.
Chcemy znaleźć równania ruchu tych mas.
Mamy:
E
k
i
n
=
m
1
x
1
˙
2
2
+
m
2
x
2
˙
2
2
,
{\displaystyle E_{kin}={\frac {m_{1}{\dot {x_{1}}}^{2}}{2}}+{\frac {m_{2}{\dot {x_{2}}}^{2}}{2}},}
E
p
o
t
=
m
1
g
(
−
x
1
)
+
m
2
g
(
−
x
2
)
,
{\displaystyle E_{pot}=m_{1}g(-x_{1})+m_{2}g(-x_{2}),}
czyli lagrangian ma postać:
L
=
E
k
i
n
−
E
p
o
t
=
m
1
x
1
˙
2
2
+
m
2
x
2
˙
2
2
+
m
1
g
x
1
+
m
2
g
x
2
.
{\displaystyle L=E_{kin}-E_{pot}={\frac {m_{1}{\dot {x_{1}}}^{2}}{2}}+{\frac {m_{2}{\dot {x_{2}}}^{2}}{2}}+m_{1}gx_{1}+m_{2}gx_{2}.}
A ponieważ linka jest nierozciągliwa
x
1
=
−
x
2
+
C
,
{\displaystyle x_{1}=-x_{2}+C,}
gdzie C jest pewną stałą związana z długością linki. Otrzymujemy lagrangian zależny tylko od jednej współrzędnej:
L
=
(
m
1
+
m
2
)
x
1
˙
2
2
+
(
m
1
−
m
2
)
g
x
1
+
m
2
g
C
.
{\displaystyle L={\frac {(m_{1}+m_{2}){\dot {x_{1}}}^{2}}{2}}+(m_{1}-m_{2})gx_{1}+m_{2}gC.}
Składowe równania Eulera-Lagrange’a:
d
d
t
(
∂
L
∂
x
1
˙
)
=
d
d
t
(
(
m
1
+
m
2
)
x
1
˙
)
=
(
m
1
+
m
2
)
x
1
¨
,
{\displaystyle {\frac {d}{dt}}\left({\frac {\partial L}{\partial {\dot {x_{1}}}}}\right)={\frac {d}{dt}}\left({(m_{1}+m_{2}){\dot {x_{1}}}}\right)={(m_{1}+m_{2}){\ddot {x_{1}}}},}
∂
L
∂
x
1
=
(
m
1
−
m
2
)
g
.
{\displaystyle {\frac {\partial L}{\partial x_{1}}}=(m_{1}-m_{2})g.}
Z równania Eulera-Lagrange’a:
d
d
t
(
∂
L
∂
x
1
˙
)
−
∂
L
∂
x
1
=
(
m
1
+
m
2
)
x
1
¨
−
(
m
1
−
m
2
)
g
=
0.
{\displaystyle {\frac {d}{dt}}\left({\frac {\partial L}{\partial {\dot {x_{1}}}}}\right)-{\frac {\partial L}{\partial x_{1}}}={(m_{1}+m_{2}){\ddot {x_{1}}}}-(m_{1}-m_{2})g=0.}
Rozwiązując względem
x
¨
1
,
{\displaystyle {\ddot {x}}_{1},}
otrzymujemy stałe przyspieszenie:
x
1
¨
=
m
1
−
m
2
m
1
+
m
2
g
.
{\displaystyle {\ddot {x_{1}}}={\frac {m_{1}-m_{2}}{m_{1}+m_{2}}}g.}
Całkując powyższe równanie dwukrotnie, otrzymamy:
x
1
(
t
)
=
m
1
−
m
2
m
1
+
m
2
g
t
2
2
+
v
1
(
0
)
t
+
x
1
(
0
)
,
{\displaystyle x_{1}(t)={\frac {m_{1}-m_{2}}{m_{1}+m_{2}}}g{\frac {t^{2}}{2}}+v_{1}(0)t+x_{1}(0),}
gdzie
v
1
(
0
)
{\displaystyle v_{1}(0)}
i
x
1
(
0
)
{\displaystyle x_{1}(0)}
to prędkość i położenie masy
m
1
{\displaystyle m_{1}}
w chwili
t
=
0.
{\displaystyle t=0.}
Trajektorię drugiego ciała łatwo teraz wyznaczyć:
x
2
(
t
)
=
−
x
1
(
t
)
+
C
.
{\displaystyle x_{2}(t)=-x_{1}(t)+C.}
Osobny artykuł: Brachistochrona .
Brachistochrona to taka krzywa łącząca punkty A i B, że czas ruchu masy punktowej od punktu A do B pod wpływem siły ciężkości
m
g
{\displaystyle mg}
jest minimalny. Problem znajdowania takiej krzywej można rozwiązać przy użyciu równania Eulera-Lagrange’a. W tym przypadku szukamy takiej krzywej
y
(
x
)
,
{\displaystyle y(x),}
żeby czas
t
{\displaystyle t}
był minimalny:
t
=
∫
A
B
d
s
v
,
{\displaystyle t=\int \limits _{A}^{B}{\frac {ds}{v}},}
gdzie:
v
=
2
g
y
{\displaystyle v={\sqrt {2gy}}}
– prędkość ciała, której zależność od
y
{\displaystyle y}
wynika z zasady zachowania energii ,
d
s
=
d
x
2
+
d
y
2
=
(
x
′
(
y
)
)
2
+
1
d
y
{\displaystyle ds={\sqrt {dx^{2}+dy^{2}}}={\sqrt {(x'(y))^{2}+1}}dy}
– różniczka drogi.
Podstawiając, otrzymujemy:
t
=
1
2
g
∫
A
B
x
′
(
y
)
2
+
1
y
d
y
=
1
2
g
∫
A
B
f
d
y
,
{\displaystyle t={\frac {1}{\sqrt {2g}}}\int \limits _{A}^{B}{\sqrt {\frac {{x'(y)}^{2}+1}{y}}}dy={\frac {1}{\sqrt {2g}}}\int \limits _{A}^{B}fdy,}
gdzie:
f
=
x
′
(
y
)
2
+
1
y
.
{\displaystyle f={\sqrt {\frac {{x'(y)}^{2}+1}{y}}}.}
Czas ruchu będzie minimalny dla krzywej
x
(
y
)
{\displaystyle x(y)}
spełniającej równanie Eulera-Lagrange’a:
d
d
y
∂
f
∂
x
′
−
∂
f
∂
x
=
0.
{\displaystyle {\frac {d}{dy}}{\frac {\partial f}{\partial x'}}-{\frac {\partial f}{\partial x}}=0.}
Rozwiązując to równanie, otrzymujemy brachistochronę:
x
(
θ
)
=
1
2
k
2
(
θ
−
sin
θ
)
,
{\displaystyle x(\theta )={\frac {1}{2}}k^{2}(\theta -\sin \theta ),}
y
(
θ
)
=
1
2
k
2
(
1
−
cos
θ
)
,
{\displaystyle y(\theta )={\frac {1}{2}}k^{2}(1-\cos \theta ),}
gdzie
k
{\displaystyle k}
to stała zależna od warunków brzegowych, czyli od punktów A i B.
Osobny artykuł: Krzywa łańcuchowa .
Równanie Eulera-Lagrange’a pozwala także wyznaczyć krzywą łańcuchową[3] , która opisuje kształt doskonale nierozciągliwej i nieskończenie wiotkiej liny o niezerowej masie swobodnie zwisającej między dwoma punktami A i B w jednorodnym polu grawitacyjnym
g
.
{\displaystyle g.}
Układ mechaniczny jest w równowadze , gdy jego energia potencjalna jest minimalna. Energia potencjalna wynosi:
E
p
o
t
=
∫
A
B
ρ
g
y
(
x
)
d
s
,
{\displaystyle E_{pot}=\int \limits _{A}^{B}\rho gy(x)ds,}
gdzie:
ρ
{\displaystyle \rho }
– gęstość liniowa linki,
d
s
=
d
x
2
+
d
y
2
=
1
+
(
y
′
(
x
)
)
2
d
x
{\displaystyle ds={\sqrt {dx^{2}+dy^{2}}}={\sqrt {1+(y'(x))^{2}}}dx}
– różniczka długości krzywej.
Podstawiając, otrzymujemy:
E
p
o
t
=
ρ
g
∫
x
1
x
2
y
1
+
(
y
′
(
x
)
)
2
d
x
=
ρ
g
∫
x
1
x
2
f
d
x
,
{\displaystyle E_{pot}=\rho g\int \limits _{x_{1}}^{x_{2}}y{\sqrt {1+(y'(x))^{2}}}dx=\rho g\int \limits _{x_{1}}^{x_{2}}fdx,}
gdzie:
f
=
y
1
+
(
y
′
(
x
)
)
2
.
{\displaystyle f=y{\sqrt {1+(y'(x))^{2}}}.}
Aby energia potencjalna była minimalna,
f
{\displaystyle f}
musi spełniać równanie Eulera-Lagrange’a:
d
d
x
∂
f
∂
y
′
−
∂
f
∂
y
=
0.
{\displaystyle {\frac {d}{dx}}{\frac {\partial f}{\partial y'}}-{\frac {\partial f}{\partial y}}=0.}
Rozwiązując to równanie, otrzymujemy postać krzywej łańcuchowej :
y
(
x
)
=
a
cosh
(
x
a
)
,
{\displaystyle y(x)=a\,\cosh \left({\frac {x}{a}}\right),}
gdzie
a
{\displaystyle a}
jest stałą zależną od długości liny i położenia punktów A i B.
Niech
x
{\displaystyle x}
będzie ciągłą funkcją parametru
t
{\displaystyle t}
o zadanych warunkach początkowych i końcowych:
x
:
R
→
R
n
{\displaystyle x\colon \mathbb {R} \to \mathbb {R} ^{n}}
i
x
(
t
1
)
=
x
1
,
x
(
t
2
)
=
x
2
.
{\displaystyle x(t_{1})=x_{1},x(t_{2})=x_{2}.}
Mamy daną funkcję
L
(
x
,
x
′
,
t
)
{\displaystyle L(x,x',t)}
i szukamy takich
x
(
t
)
,
{\displaystyle x(t),}
żeby
S
[
x
]
=
∫
t
1
t
2
L
d
t
{\displaystyle S[x]=\int \limits _{t_{1}}^{t_{2}}Ldt}
było stacjonarne.
Załóżmy, że
x
0
{\displaystyle x_{0}}
jest takim rozwiązaniem.
Wprowadźmy do rozważań parametr
α
∈
R
{\displaystyle \alpha \in \mathbb {R} }
niezależny od czasu oraz funkcję ciągłą
φ
(
t
)
{\displaystyle \varphi (t)}
taką, że
φ
(
t
1
)
=
0
{\displaystyle \varphi (t_{1})=0}
oraz
φ
(
t
2
)
=
0.
{\displaystyle \varphi (t_{2})=0.}
Jeżeli przyjmiemy, że
x
=
x
0
+
α
φ
,
{\displaystyle x=x_{0}+\alpha \varphi ,}
to zagadnienie sprowadzi się do analizy funkcji jednej zmiennej
α
{\displaystyle \alpha }
S
(
α
)
=
∫
t
1
t
2
L
(
x
0
+
α
φ
,
x
0
′
+
α
φ
′
,
t
)
d
t
.
{\displaystyle S(\alpha )=\int \limits _{t_{1}}^{t_{2}}L(x_{0}+\alpha \varphi ,{x_{0}}'+\alpha \varphi ',t)dt.}
Gdy
S
{\displaystyle S}
jest stacjonarne, to
d
S
d
α
=
0
,
{\displaystyle {\frac {dS}{d\alpha }}=0,}
d
S
d
α
=
∫
t
1
t
2
∂
L
∂
α
d
t
{\displaystyle {\frac {dS}{d\alpha }}=\int \limits _{t_{1}}^{t_{2}}{\frac {\partial L}{\partial \alpha }}dt}
– twierdzenie Leibniza (o różniczkowaniu pod znakiem całki) .
Korzystając ze wzoru na pochodną funkcji złożonej , otrzymujemy:
0
=
d
S
d
α
=
∫
t
1
t
2
(
φ
∂
L
∂
x
+
φ
′
∂
L
∂
x
′
)
d
t
=
∫
t
1
t
2
φ
∂
L
∂
x
d
t
+
∫
t
1
t
2
φ
′
∂
L
∂
x
′
d
t
.
{\displaystyle 0={\frac {dS}{d\alpha }}=\int \limits _{t_{1}}^{t_{2}}(\varphi {\frac {\partial L}{\partial x}}+\varphi '{\frac {\partial L}{\partial x'}})dt=\int \limits _{t_{1}}^{t_{2}}\varphi {\frac {\partial L}{\partial x}}dt+\int \limits _{t_{1}}^{t_{2}}\varphi '{\frac {\partial L}{\partial x'}}dt.}
Całkując drugi człon przez części , mamy:
0
=
∫
t
1
t
2
φ
∂
L
∂
x
d
t
+
[
φ
(
t
)
∂
L
∂
x
′
]
t
1
t
2
−
∫
t
1
t
2
φ
d
d
t
∂
L
∂
x
′
d
t
.
{\displaystyle 0=\int \limits _{t_{1}}^{t_{2}}\varphi {\frac {\partial L}{\partial x}}dt+\left[\varphi (t){\frac {\partial L}{\partial x'}}\right]_{t_{1}}^{t_{2}}-\int \limits _{t_{1}}^{t_{2}}\varphi {\frac {d}{dt}}{\frac {\partial L}{\partial x'}}dt.}
Ponieważ
x
(
t
1
)
=
x
1
{\displaystyle x(t_{1})=x_{1}}
dla każdego
x
,
{\displaystyle x,}
więc
φ
(
t
1
)
=
0.
{\displaystyle \varphi (t_{1})=0.}
Podobnie
φ
(
t
2
)
=
0.
{\displaystyle \varphi (t_{2})=0.}
Wobec tego
[
φ
(
t
)
∂
L
∂
x
′
]
t
1
t
2
=
0
{\displaystyle \left[\varphi (t){\frac {\partial L}{\partial x'}}\right]_{t_{1}}^{t_{2}}=0}
i stąd
0
=
∫
t
1
t
2
φ
(
∂
L
∂
x
−
d
d
t
∂
L
∂
x
′
)
d
t
.
{\displaystyle 0=\int \limits _{t_{1}}^{t_{2}}\varphi \left({\frac {\partial L}{\partial x}}-{\frac {d}{dt}}{\frac {\partial L}{\partial x'}}\right)dt.}
Ponieważ warunek ten musi być spełniony dla dowolnej funkcji
φ
(
t
)
,
{\displaystyle \varphi (t),}
więc otrzymamy równanie
∂
L
∂
x
−
d
d
t
∂
L
∂
x
′
=
0
{\displaystyle {\frac {\partial L}{\partial x}}-{\frac {d}{dt}}{\frac {\partial L}{\partial x'}}=0}
stanowiące warunek konieczny istnienia ekstremum funkcjonału
S
[
x
]
.
{\displaystyle S[x].}
Uogólnienia dla kilku funkcji, kilku zmiennych, wyższych pochodnych
edytuj
Pojedyncza funkcja jednej zmiennej z wyższymi pochodnymi
edytuj
Wartość stacjonarna funkcjonału
I
[
f
]
=
∫
x
0
x
1
L
(
x
,
f
,
f
′
,
f
″
,
…
,
f
(
k
)
)
d
x
;
f
′
:=
d
f
d
x
,
f
″
:=
d
2
f
d
x
2
,
f
(
k
)
:=
d
k
f
d
x
k
{\displaystyle I[f]=\int _{x_{0}}^{x_{1}}{\mathcal {L}}(x,f,f',f'',\dots ,f^{(k)})~\mathrm {d} x;\;\;f':={\frac {\mathrm {d} f}{\mathrm {d} x}},\;\;f'':={\frac {\mathrm {d} ^{2}f}{\mathrm {d} x^{2}}},\;\;f^{(k)}:={\frac {\mathrm {d} ^{k}f}{\mathrm {d} x^{k}}}}
można otrzymać z równań Eulera-Lagrange’a postaci
∂
L
∂
f
−
d
d
x
(
∂
L
∂
f
′
)
+
d
2
d
x
2
(
∂
L
∂
f
″
)
−
…
+
(
−
1
)
k
d
k
d
x
k
(
∂
L
∂
f
(
k
)
)
=
0
,
{\displaystyle {\frac {\partial {\mathcal {L}}}{\partial f}}-{\frac {\mathrm {d} }{\mathrm {d} x}}\left({\frac {\partial {\mathcal {L}}}{\partial f'}}\right)+{\frac {\mathrm {d} ^{2}}{\mathrm {d} x^{2}}}\left({\frac {\partial {\mathcal {L}}}{\partial f''}}\right)-\ldots +(-1)^{k}{\frac {\mathrm {d} ^{k}}{\mathrm {d} x^{k}}}\left({\frac {\partial {\mathcal {L}}}{\partial f^{(k)}}}\right)=0,}
przy ustalonych warunkach brzegowych dla funkcji i jej pochodnych od pierwszej do
k
−
1
{\displaystyle k-1}
(tj. dla
f
(
i
)
,
i
∈
{
0
,
…
,
k
−
1
}
{\displaystyle f^{(i)},i\in \{0,\dots ,k-1\}}
). Punkty brzegowe pochodnej
f
(
k
)
{\displaystyle f^{(k)}}
są dowolne.
Kilka funkcji jednej zmiennej z pochodną I rzędu
edytuj
Jeżeli mamy funkcje
(
f
1
,
f
2
,
…
,
f
m
)
{\displaystyle (f_{1},f_{2},\dots ,f_{m})}
zmiennej
(
x
)
{\displaystyle (x)}
to szukamy extremum funkcjonału
I
[
f
1
,
f
2
,
…
,
f
m
]
=
∫
x
0
x
1
L
(
x
,
f
1
,
f
2
,
…
,
f
m
,
f
1
′
,
f
2
′
,
…
,
f
m
′
)
d
x
;
f
i
′
:=
d
f
i
d
x
.
{\displaystyle I[f_{1},f_{2},\dots ,f_{m}]=\int _{x_{0}}^{x_{1}}{\mathcal {L}}(x,f_{1},f_{2},\dots ,f_{m},f_{1}',f_{2}',\dots ,f_{m}')\mathrm {d} x;\;\;f_{i}':={\frac {\mathrm {d} f_{i}}{\mathrm {d} x}}.}
Równania Eulera-Lagrange’a mają postać
∂
L
∂
f
i
−
d
d
x
(
∂
L
∂
f
i
′
)
=
0
,
i
=
1
,
2
,
…
,
m
.
{\displaystyle {\frac {\partial {\mathcal {L}}}{\partial f_{i}}}-{\frac {\mathrm {d} }{\mathrm {d} x}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{i}'}}\right)=0,\quad i=1,2,\dots ,m.}
Pojedyncza funkcja kilku zmiennych z pochodną I rzędu
edytuj
Jeżeli funkcja zależy od wielu zmiennych jest określona na pewnej powierzchni
Ω
,
{\displaystyle \Omega ,}
to
I
[
f
]
=
∫
Ω
L
(
x
1
,
…
,
x
n
,
f
,
f
,
1
,
…
,
f
,
n
)
d
x
;
f
,
j
:=
∂
f
∂
x
j
{\displaystyle I[f]=\int _{\Omega }{\mathcal {L}}(x_{1},\dots ,x_{n},f,f_{,1},\dots ,f_{,n})\,\mathrm {d} \mathbf {x} ;\;\;f_{,j}:={\frac {\partial f}{\partial x_{j}}}}
osiąga ekstremum, gdy
∂
L
∂
f
−
∑
j
=
1
n
∂
∂
x
j
(
∂
L
∂
f
,
j
)
=
0.
{\displaystyle {\frac {\partial {\mathcal {L}}}{\partial f}}-\sum _{j=1}^{n}{\frac {\partial }{\partial x_{j}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{,j}}}\right)=0.}
Dla
n
=
2
{\displaystyle n=2}
funkcjonał
I
{\displaystyle {\mathcal {I}}}
jest funkcjonałem energii; ekstremum jest powierzchnią minimalną (np. bańki mydlanej).
Kilka funkcji kilku zmiennych z pochodnymi I rzędu
edytuj
Jeśli trzeba wyznaczyć kilka nieznanych funkcji o wielu zmiennych, takich że
I
[
f
1
,
f
2
,
…
,
f
m
]
=
∫
Ω
L
(
x
1
,
…
,
x
n
,
f
1
,
…
,
f
m
,
f
1
,
1
,
…
,
f
1
,
n
,
…
,
f
m
,
1
,
…
,
f
m
,
n
)
d
x
{\displaystyle I[f_{1},f_{2},\dots ,f_{m}]=\int _{\Omega }{\mathcal {L}}(x_{1},\dots ,x_{n},f_{1},\dots ,f_{m},f_{1,1},\dots ,f_{1,n},\dots ,f_{m,1},\dots ,f_{m,n})\,\mathrm {d} \mathbf {x} }
f
i
,
j
:=
∂
f
i
∂
x
j
,
{\displaystyle f_{i,j}:={\frac {\partial f_{i}}{\partial x_{j}}},}
to układ równań Eulera-Lagrange’a ma postać
∂
L
∂
f
1
−
∑
j
=
1
n
∂
∂
x
j
(
∂
L
∂
f
1
,
j
)
=
0
1
,
∂
L
∂
f
2
−
∑
j
=
1
n
∂
∂
x
j
(
∂
L
∂
f
2
,
j
)
=
0
2
,
⋮
∂
L
∂
f
m
−
∑
j
=
1
n
∂
∂
x
j
(
∂
L
∂
f
m
,
j
)
=
0
m
.
{\displaystyle {\begin{aligned}{\frac {\partial {\mathcal {L}}}{\partial f_{1}}}-\sum _{j=1}^{n}{\frac {\partial }{\partial x_{j}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{1,j}}}\right)&=0_{1},\\{\frac {\partial {\mathcal {L}}}{\partial f_{2}}}-\sum _{j=1}^{n}{\frac {\partial }{\partial x_{j}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{2,j}}}\right)&=0_{2},\\\vdots \qquad \qquad \\{\frac {\partial {\mathcal {L}}}{\partial f_{m}}}-\sum _{j=1}^{n}{\frac {\partial }{\partial x_{j}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{m,j}}}\right)&=0_{m}.\end{aligned}}}
Pojedyncza funkcja o 2 zmiennych z wyższymi pochodnymi
edytuj
Jeżeli nieznana funkcja
f
{\displaystyle f}
zależy od dwóch zmiennych
x
1
{\displaystyle x_{1}}
oraz
x
2
{\displaystyle x_{2}}
i jeżeli funkcjonał zależy od wyższych pochodnych funkcji – od pierwszej aż do
n
{\displaystyle n}
-tej, tj.
I
[
f
]
=
∫
Ω
L
(
x
1
,
x
2
,
f
,
f
,
1
,
f
,
2
,
f
,
11
,
f
,
12
,
f
,
22
,
…
,
f
,
22
…
2
)
d
x
f
,
i
:=
∂
f
∂
x
i
,
f
,
i
j
:=
∂
2
f
∂
x
i
∂
x
j
,
…
{\displaystyle {\begin{aligned}I[f]&=\int _{\Omega }{\mathcal {L}}(x_{1},x_{2},f,f_{,1},f_{,2},f_{,11},f_{,12},f_{,22},\dots ,f_{,22\dots 2})\,\mathrm {d} \mathbf {x} \\&\qquad \quad f_{,i}:={\frac {\partial f}{\partial x_{i}}}\;,\quad f_{,ij}:={\frac {\partial ^{2}f}{\partial x_{i}\partial x_{j}}}\;,\;\;\dots \end{aligned}}}
to równanie Eulera-Lagrange’a ma postać
∂
L
∂
f
−
∂
∂
x
1
(
∂
L
∂
f
,
1
)
−
∂
∂
x
2
(
∂
L
∂
f
,
2
)
+
∂
2
∂
x
1
2
(
∂
L
∂
f
,
11
)
+
∂
2
∂
x
1
∂
x
2
(
∂
L
∂
f
,
12
)
+
∂
2
∂
x
2
2
(
∂
L
∂
f
,
22
)
−
…
+
(
−
1
)
k
∂
k
∂
x
2
k
(
∂
L
∂
f
,
22
…
2
)
=
0
,
{\displaystyle {\begin{aligned}&{\frac {\partial {\mathcal {L}}}{\partial f}}-{\frac {\partial }{\partial x_{1}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{,1}}}\right)-{\frac {\partial }{\partial x_{2}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{,2}}}\right)+{\frac {\partial ^{2}}{\partial x_{1}^{2}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{,11}}}\right)+{\frac {\partial ^{2}}{\partial x_{1}\partial x_{2}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{,12}}}\right)+{\frac {\partial ^{2}}{\partial x_{2}^{2}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{,22}}}\right)\\&-\ldots +(-1)^{k}{\frac {\partial ^{k}}{\partial x_{2}^{k}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{,22\dots 2}}}\right)=0,\end{aligned}}}
co można krótko zapisać w postaci
∂
L
∂
f
+
∑
j
=
1
n
∑
μ
1
⩽
…
⩽
μ
j
(
−
1
)
j
∂
j
∂
x
μ
1
…
∂
x
μ
j
(
∂
L
∂
f
,
μ
1
…
μ
j
)
=
0
,
{\displaystyle {\frac {\partial {\mathcal {L}}}{\partial f}}+\sum _{j=1}^{n}\sum _{\mu _{1}\leqslant \ldots \leqslant \mu _{j}}(-1)^{j}{\frac {\partial ^{j}}{\partial x_{\mu _{1}}\dots \partial x_{\mu _{j}}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{,\mu _{1}\dots \mu _{j}}}}\right)=0,}
gdzie
μ
1
…
μ
j
{\displaystyle \mu _{1}\dots \mu _{j}}
są indeksami które przebiegają od 1 do liczny zmiennych, np. tutaj przyjmują wartości od 1do 2. Sumowanie po indeksach
μ
1
…
μ
j
{\displaystyle \mu _{1}\dots \mu _{j}}
jest takie, że
μ
1
⩽
μ
2
⩽
…
⩽
μ
j
{\displaystyle \mu _{1}\leqslant \mu _{2}\leqslant \ldots \leqslant \mu _{j}}
tzn. nie może być sumowania tej samej pochodnej cząstkowej dwa razy – po przestawieniu kolejności zmiennych; np.
f
,
12
=
f
,
21
{\displaystyle f_{,12}=f_{,21}}
pojawia się tylko jeden raz.
Kilka funkcji o kilku zmiennych z wyższymi pochodnymi
edytuj
Jeżeli jest
p
{\displaystyle p}
nieznanych funkcji
f
i
{\displaystyle f_{i}}
zależnych od
m
{\displaystyle m}
zmiennych
x
1
…
x
m
{\displaystyle x_{1}\dots x_{m}}
oraz funkcjonał zależy od pochodnych tych funkcji aż do
n
{\displaystyle n}
-tego rzędu, tj.
I
[
f
1
,
…
,
f
p
]
=
∫
Ω
L
(
x
1
,
…
,
x
n
;
f
1
,
…
,
f
p
;
f
1
,
1
,
…
,
f
p
,
m
;
f
1
,
11
,
…
,
f
p
,
m
m
;
…
;
f
p
,
m
…
m
)
d
x
f
i
,
μ
:=
∂
f
i
∂
x
μ
,
f
i
,
μ
1
μ
2
:=
∂
2
f
i
∂
x
μ
1
∂
x
μ
2
,
…
{\displaystyle {\begin{aligned}I[f_{1},\dots ,f_{p}]&=\int _{\Omega }{\mathcal {L}}(x_{1},\dots ,x_{n};f_{1},\dots ,f_{p};f_{1,1},\dots ,f_{p,m};f_{1,11},\dots ,f_{p,mm};\dots ;f_{p,m\ldots m})\,\mathrm {d} \mathbf {x} \\&\qquad \quad f_{i,\mu }:={\frac {\partial f_{i}}{\partial x_{\mu }}}\;,\quad f_{i,\mu _{1}\mu _{2}}:={\frac {\partial ^{2}f_{i}}{\partial x_{\mu _{1}}\partial x_{\mu _{2}}}}\;,\;\;\dots \end{aligned}}}
gdzie
μ
1
…
μ
j
{\displaystyle \mu _{1}\dots \mu _{j}}
są indeksami o wartościach od 1 do m (tj. do liczby zmiennych), to równania Eulera-Lagrange’a mają postać
∂
L
∂
f
i
+
∑
j
=
1
n
∑
μ
1
⩽
…
⩽
μ
j
(
−
1
)
j
∂
j
∂
x
μ
1
…
∂
x
μ
j
(
∂
L
∂
f
i
,
μ
1
…
μ
j
)
=
0
,
{\displaystyle {\frac {\partial {\mathcal {L}}}{\partial f_{i}}}+\sum _{j=1}^{n}\sum _{\mu _{1}\leqslant \ldots \leqslant \mu _{j}}(-1)^{j}{\frac {\partial ^{j}}{\partial x_{\mu _{1}}\dots \partial x_{\mu _{j}}}}\left({\frac {\partial {\mathcal {L}}}{\partial f_{i,\mu _{1}\dots \mu _{j}}}}\right)=0,}
gdzie sumowanie po indeksach
μ
1
…
μ
j
{\displaystyle \mu _{1}\dots \mu _{j}}
jest takie, by nie powtarzać sumowania samych pochodnych cząstkowych
f
i
,
μ
1
μ
2
=
f
i
,
μ
2
μ
1
{\displaystyle f_{i,\mu _{1}\mu _{2}}=f_{i,\mu _{2}\mu _{1}}}
kilka razy (podobnie jak w podrozdziale powyżej). Można to wyrazić w bardziej zwarty sposób w postaci:
∑
j
=
0
n
∑
μ
1
⩽
…
⩽
μ
j
(
−
1
)
j
∂
μ
1
…
μ
j
j
(
∂
L
∂
f
i
,
μ
1
…
μ
j
)
=
0.
{\displaystyle \sum _{j=0}^{n}\sum _{\mu _{1}\leqslant \ldots \leqslant \mu _{j}}(-1)^{j}\partial _{\mu _{1}\ldots \mu _{j}}^{j}\left({\frac {\partial {\mathcal {L}}}{\partial f_{i,\mu _{1}\dots \mu _{j}}}}\right)=0.}
Uogólnienia na rozmaitości
edytuj
Niech
M
{\displaystyle M}
będzie gładką rozmaitością oraz niech
C
∞
(
[
a
,
b
]
)
{\displaystyle C^{\infty }([a,b])}
oznacza przestrzeń funkcji gładkich
f
:
[
a
,
b
]
→
M
.
{\displaystyle f\colon [a,b]\to M.}
Wtedy dla funkcjonałów
S
:
C
∞
(
[
a
,
b
]
)
→
R
{\displaystyle S\colon C^{\infty }([a,b])\to \mathbb {R} }
w postaci
S
[
f
]
=
∫
a
b
(
L
∘
f
˙
)
(
t
)
d
t
,
{\displaystyle S[f]=\int _{a}^{b}(L\circ {\dot {f}})(t)\,\mathrm {d} t,}
gdzie
L
:
T
M
→
R
{\displaystyle L\colon TM\to \mathbb {R} }
jest lagrangianem wyrażenie
d
S
f
=
0
{\displaystyle \mathrm {d} S_{f}=0}
jest równoważne warunkowi, że dla wszystkich
t
∈
[
a
,
b
]
,
{\displaystyle t\in [a,b],}
każdy układ
(
x
i
,
X
i
)
{\displaystyle (x^{i},X^{i})}
w sąsiedztwie
f
˙
(
t
)
{\displaystyle {\dot {f}}(t)}
prowadzi do
dim
M
{\displaystyle \dim M}
o równaniach:
∀
i
:
d
d
t
∂
F
∂
X
i
|
f
˙
(
t
)
=
∂
F
∂
x
i
|
f
˙
(
t
)
.
{\displaystyle \forall i\colon {\frac {\mathrm {d} }{\mathrm {d} t}}{\frac {\partial F}{\partial X^{i}}}{\bigg |}_{{\dot {f}}(t)}={\frac {\partial F}{\partial x^{i}}}{\bigg |}_{{\dot {f}}(t)}.}
Układy rozwiązane za pomocą równań Eulera-Lagrange'a: