Die Hamilton-Jacobi-Gleichung đŸ§» (Teil II)
German

Die Hamilton-Jacobi-Gleichung đŸ§» (Teil II)

—

by

science
physics

Die Hamilton-Jacobi-Gleichung (Teil II)

H(q, ∂S/∂q, t) + ∂S/∂t = 0

Eigentlich wollte ich sofort mit dem nÀchsten Thema anfangen (welches ich noch nicht erwÀhne, um die Spannung beizubehalten!), aber ich finde, dass ich die Hamilton-Jacobi-Gleichung doch nicht zufriedenstellend erklÀrt habe. Dieser Text ist also die Fortsetzung von https://journaly.com/post/8296. Ich hoffe sehr, dass die ErlÀuterungen in diesem Post zum besseren VerstÀndnis der Hamilton-Jacobi-Gleichung beitragen. Willkommen!

Zuerst ein Hinweis in eigener Sache. Einige der Schwierigkeiten, die ich stets beim Schreiben der BeitrĂ€ge zur theoretischen Mechanik habe, sind: (1) Es gibt mehrere Formalismen der klassischen Mechanik (Newton, Lagrange, Hamilton, Hamilton-Jacobi). (2) Es gibt sehr viele Verbindungen innerhalb der bzw. zwischen den einzelnen Formalismen. (3) Die Begrifflichkeiten, die Hauptergebnisse und die weiteren Einsichten sind sowohl mathematisch anspruchsvoll als auch abstrakt. Ich bemĂŒhe mich, die Physik (also die physikalischen Einsichten und Hauptideen hinter dem Ganzen) sprachlich und weitgehend ohne Formeln zu vermitteln. Dabei ist mir zu jeder Zeit sehr wichtig, die physikalische Korrektheit zu bewahren (d. h. das, was ich schreibe, ist meines Wissens nach wahrheitsgetreu). Übliche populĂ€rwissenschaftliche Texte enthalten zu oft vage und irrefĂŒhrende Analogien. Das mag ich nicht. Statt Analogien und (ĂŒberstrapazierte) Vereinfachungen, versuche ich, die Physik hinter den Formalismen und Formeln wie eine Tour durch Geschichte und Gedanken des zu besprechenden physikalischen Themas zu vermitteln. Wie gesagt, womöglich ohne abgefahrene Mathematik.

Warum schreibe ich darĂŒber? Nun, weil es in diesem Text noch einmal sehr schwierig wird, die Physik so zu vermitteln, wie ich idealerweise möchte, also ohne Einsatz von Mathematik und technischem Geschwafel. Das Thema der Hamilton-Jacobi-Gleichung ist gewissermaßen der Höhepunkt der klassichen Mechanik. Das ist an sich eine schöne Sache, aber es bedeutet nun mal auch, dass (um sie wirklich zu verstehen), tiefe(re) Vorkenntnisse in Mathematik und Physik notwendig sind. Mein persönliches Empfinden sagt mir, dass es alleine auf begrifflicher Ebene sehr viele Querverbindungen gibt; diese im Kopf zu behalten ist schon eine kleine Herausforderung. Um dies einigermaßen zu vereinfachen, gab es im letzten Text eine Zusammenfassung der Geschehnisse und viele Links zu den vorigen physikalischen Texten, welche an dieser Stelle relevant sein könnten. Hinweis: Vor allem die Texte ĂŒber Variationsrechnung, lagrangesche Mechanik und hamiltonsche Mechanik sind von hoher Bedeutung.

So, jetzt ist es raus. Nun kann ich getrost weiter schreiben und es noch schlimmer machen. Es wird nicht ganz einfach. Ich habe euch gewarnt!

Um die Hamilton-Jacobi-Gleichung zu besprechen, sollte ich zuerst noch einmal die hamiltonsche Mechanik rekapitulieren und danach die kanonischen Gleichungen behandeln. Erst dann kann man halbwegs verstehen, was die Hamilton-Jacobi-Gleichung denn genau ist, woher sie kommt und wofĂŒr sie gut ist. Fangen wir mit der hamiltonschen Mechanik an.

Die hamiltonsche Mechanik (https://journaly.com/post/4656) hat als Startpunkt das sogenannte hamiltonsche Prinzip. Laut hamiltonschem Prinzip ist die „Wirkung“ eine sehr wichtige physikalische GrĂ¶ĂŸe, denn diese ist bei der Evolution eines physikalischen Systems immer stationĂ€r. Die Wirkung ist eine physikalische GrĂ¶ĂŸe, welche im Beitrag ĂŒber die lagrangesche Mechanik (https://journaly.com/post/4565) halbwegs erklĂ€rt bzw. erwĂ€hnt wurde.

Alleine um den Begriff der Wirkung wirklich zu verstehen, sind Kenntnisse der mathematischen Analysis nötig bzw. hilfreich. Die Wirkung ist das zeitliche Integral der Lagrange-Funktion zwischen Anfangs- und Endzeitpunkt der Evolution des physikalischen Systems. Sie ist damit eine skalare GrĂ¶ĂŸe (eine Zahl) mit den physikalischen Einheiten von Energie mal Zeit. Die Wirkung an sich hat (zumindest an dieser Stelle) keine physikalische oder anschauliche Interpretation. Sie ist dennoch eine wichtige physikalische GrĂ¶ĂŸe, welche die globale zeitliche Evolution eines Systems darstellt. Mit anderen Worten: Betrachtet man die zeitliche Evolution eines physikalischen Systems zwischen zwei gegebenen Zeitpunkten, so kann man (bei bekannter Lagrange-Funktion, also bei bekannter Physik des Systems) den Wert der Wirkung berechnen. Dieser Wert an sich ist dann irgendeine Zahl. Der konkrete Wert der Wirkung, also der konkrete Wert der wirklich stattfindenden Evolution des Systems, ist nicht von Bedeutung. Was zĂ€hlt, ist die Aussage des hamiltonschen Prinzips: Die Wirkung ist stationĂ€r.

HĂ€?

Das hamiltonsche Prinzip besagt: Die Variation der Wirkung ist null. Die „Variation“ ist ein mathematischer Begriff, die entsprechende Mathematik ist die Variationsrechnung.

Die „Wirkung“ alleine mag vielleicht kein physikalisch ersichtlicher Begriff sein, aber die Idee hinter der „Variation der Wirkung“ ist sehr wohl anschaulich: Der Anfangs- und Endzeitpunkt der Evolution eines physikalischen Systems werden festgehalten (d. h. wir stellen uns vor, dass ein beliebiges physikalisches System zwischen zwei konkreten Zeitpunkten seinen Zustand Ă€ndert; in Gedanken können wir die beiden Zeitpunkte beliebig auswĂ€hlen und festhalten). Die „physikalische Evolution“ eines Systems ist (anschaulich gesprochen) eine Kurve in einem abstrakten mathematischen Raum. Die „Wirkung“ ist der Wert des Zeitintegrals entlang der tatsĂ€chlich stattfindenden Kurve. Die „Variation der Wirkung“ ist der Vorgang oder die mathematische Vorschrift, die „wirkliche“ Kurve auf eine bestimmte Art und Weise zu verformen bzw. zu verĂ€ndern. Dabei mĂŒssen diese „alternativen Kurven bzw. Evolutionen des physikalischen Systems“ immer beim vorher festgehaltenen Anfangszeitpunkt anfangen und zum Endzeitpunkt enden. Die Aussage „die Wirkung ist stationĂ€r“ bedeutet dann lediglich, dass die reale (die physikalisch beobachtbare und empirisch messbare) Evolution eines physikalischen Systems gerade diejenige ist, fĂŒr die die Variation der Wirkung den Wert Null besitzt. Oft bedeutet dies wiederum, dass die Wirkung den kleinsten Wert besitzt, was den (eigentlich falschen) Namen „Prinzip der kleinsten Wirkung“ verdeutlicht.

Die Aussage „die Wirkung ist stationĂ€r“ oder (damit Ă€quivalent) „die Variation der Wirkung ist null“ lĂ€sst sich mathematisch formulieren und fĂŒhrt zu einer konkreten Differentialgleichung: die Euler-Lagrange-Gleichung. Die zeitliche Evolution ergibt sich also als Lösung der Euler-Lagrange-Gleichung. Die grundlegende Funktion dabei ist ursprĂŒnglich die Lagrange-Funktion. Mit anderen Worten: Die lagrangesche Mechanik fĂŒhrt die Variationsrechnung als mathematische Technik in die theoretische Physik ein. Die Euler-Lagrange-Gleichung ist die mathematische Gleichung, welche zu lösen ist. Diese Gleichung hat fĂŒr alle physikalischen Problemstellungen dieselbe Form (sie ist die lokale Form des hamiltonschen Prinzips und damit Ă€quivalent). Die Einzelheiten einer konkreten physikalischen Situation werden von der Lagrange-Funktion angegeben. Diese Funktion beschreibt ein konkretes physikalisches System, die Euler-Lagrange-Gleichung gibt seine Evolution in der Zeit an. Die Lagrange-Funktion ist konkret, das hamiltonsche Prinzip und die Euler-Lagrange-Gleichung sind allgemein.

Die hamiltonsche Mechanik bedient sich der lagrangeschen Mechanik als Startpunkt. Die Lagrange-Funktion wird mithilfe einer sogenannten Legendre-Transformation in die Hamilton-Funktion sozusagen umgewandelt. Dabei wird das hamiltonsche Prinzip beibehalten, mit dem Unterschied, dass es in der hamiltonschen Mechanik keinen Konfigurationsraum (mit N Variablen), sondern den Phasenraum (mit 2N Variablen) gibt. Die Mathematik ist sozusagen Ă€hnlich, aber der mathematische Raum wird doppelt so groß wie bei der lagrangeschen Mechanik. Die Hamilton-Funktion „H“ ist eine Funktion der N generalisierten Koordinaten „q“, der N generalisierten Impulse „p“ und der Zeit „t“. Sie wird dementsprechend mit „H(q, p, t)“ notiert. Die Hamilton-Gleichungen

dp(t)/dt = - ∂H(q, p, t)/∂q

dq(t)/dt = + ∂H(q, p, t)/∂p

werden ĂŒblicherweise ohne eine explizite Angabe der Variablen geschrieben:

dp/dt = - ∂H/∂q

dq/dt = + ∂H/∂p.

Bis hier eine Zusammenfassung auf Überlichtgeschwindigkeit der lagrangeschen und hamiltonschen Mechanik der frĂŒheren BeitrĂ€ge. Nun werden wir die kanonischen Transformationen besprechen, welche letztlich zur Hamilton-Jacobi-Gleichung fĂŒhren.

Die Hamilton-Funktion H(q, p, t) hĂ€ngt also von den q-Variablen und den p-Variablen ab. Es gibt insgesamt 2N Variablen, die statt „q“ und „p“ einfach „kanonische Variablen“ heißen. Hier ist N die Anzahl der Freiheitsgrade des physikalischen Systems, welches die Hamilton-Funktion beschreibt. In der Mechanik ist das physikalische System ein mechanisches Problem, z. B. ein Pendel, ein Kreisel, das System bestehend aus Sonne und Erde, usw., aber eigentlich kann es alles Mögliche sein. Ein Vorteil der lagrangeschen und hamiltonschen Mechanik ist ihre Allgemeinheit.

In der hamiltonschen Mechanik gibt es auch eine andere Sorte von Allgemeinheit, nĂ€mlich eine mathematische: Es gibt viele Möglichkeiten fĂŒr die Wahl der kanonischen Variablen (die q- und p-Variablen). Mit anderen Worten: Es gibt eine zwar nicht freie, aber doch sehr breite Wahl der kanonischen Variablen. Die interessante Frage ist dann, wie die Verbindung bzw. die BrĂŒcke zwischen zwei verschiedenen Koordinatensystemen ist. Das ist das mathematische Problem einer Koordinatentransformation.

Konkret wird das neue Koordinatensystem mit großgeschriebenen Buchstaben notiert: Q und P. Die neue Hamilton-Funktion wird ĂŒblicherweise mit K geschrieben: K(Q, P, t). Die Zeit t ist in der nichtrelativistischen Physik ja eine universell gĂŒltige GrĂ¶ĂŸe (was eigentlich falsch ist) und wird dementsprechend „wiederverwendet“ (d. h. sie taucht in beiden Funktionen auf). Die Koordinatentransformation {q, p} -> {Q, P} (das ist lediglich eine symbolische Art und Weise, um zu sagen, dass die Q- und P-Variablen aus den bekannten q- und p-Variablen berechnet bzw. bestimmt werden können) bewirkt also, dass aus der alten Hamilton-Funktion H(q, p, t) eine neue Hamilton-Funktion K(Q, P, t) entsteht. Sowohl fĂŒr die Funktion H als auch fĂŒr die Funktion K gilt das hamiltonsche Prinzip. Mit anderen Worten: FĂŒr K mĂŒssen auch die Hamilton-Gleichungen gelten.

Die Hamilton-Gleichungen fĂŒr H sind

dp/dt = - ∂H/∂q

dq/dt = + ∂H/∂p

und die Hamilton-Gleichungen fĂŒr K lauten entsprechend

dP/dt = - ∂K/∂Q

dQ/dt = + ∂K/∂P.

Warum schreibe ich so viele Gleichungen? Nun, weil es Spaß macht, natĂŒrlich, aber auch, um Folgendes zu verdeutlichen: Die „Physik“ und die „zeitliche Evolution eines physikalischen Systems“ sind zwei verschiedene Sachen. Mit „Physik“ ist hier das „mathematisch beschriebene physikalische System“ gemeint. Die Physik bzw. das physikalische System wird also von der Hamilton-Funktion angegeben bzw. beschrieben. Die zeitliche Evolution dieses physikalischen Systems ist die Lösung der Hamilton-Gleichungen fĂŒr die Hamilton-Funktion in den gewĂ€hlten kanonischen Koordinaten.

Sowohl die Hamilton-Funktion als auch die kanonischen Variablen sind mathematisch nicht eindeutig. Statt den kanonischen Variablen {q, p} und der Hamilton-Funktion H(q, p, t) können (alternativ) die kanonischen Variablen {Q, P} und die Hamilton-Funktion K(Q, P, t) eingesetzt werden. Das an sich ist lediglich eine Umschreibung der Zeichen (p wird zu P, q wird zu Q, H wird zu K), aber es geht noch weiter.

Oh nein, es geht noch weiter ...

Achtung: Ab jetzt wird der Text wirklich abgefahren. Die meisten Leser:innen dĂŒrfen hier aussteigen. Weiterlesen auf eigene Gefahr.

Ja, jetzt wird's spannend. Die „Hamilton-Gleichungen“ heißen auch „kanonische Gleichungen“. Die Variablen der Hamilton-Funktion heißen „kanonische Variablen“ oder „kanonische Koordinaten“. Es ist dann nicht verwunderlich, dass die Koordinatentransformation zwischen den kanonischen Koordinaten {p, q} -> {P, Q} als „kanonische Transformation“ bekannt ist.

Eine kanonische Transformation ist also im Grunde nichts anderes als die Transformation

Q = Q(q, p, t)

P = P(q, p, t)

um aus den (alten) kanonischen Koordinaten {q, p} die (neuen) kanonischen Koordinaten {Q, P} zu gewinnen. Die Funktionen Q(q, p, t) und P(q, p, t) sind hier nur abstrakte Angaben: Noch wird gar nicht angegeben, welche Koordinatentransformationen ĂŒberhaupt erlaubt sind. Es sind ja eben nicht alle Koordinatentransformationen möglich, sondern nur diejenigen, welche die Hamilton-Funktion H(q, p, t) in die Hamilton-Funktion K(Q, P, t) umwandeln. Das bedeutet nur, dass auch fĂŒr K die Hamilton-Gleichungen gelten mĂŒssen. Außerdem bedeutet es auch, dass das hamiltonsche Prinzip auch fĂŒr K gĂŒltig ist.

Die Aussage „das hamiltonsche Prinzip gilt sowohl fĂŒr H als auch fĂŒr K“ gibt eine konkrete mathematische Verbindung zwischen den kanonischen Variablen und den Hamilton-Funktionen:

p dq/dt - H(q, p, t) = P dQ/dt - K(Q, P, t) + dF/dt.

An dieser Stelle (oder sonst wo) erwarte ich nicht, dass die Leser:innen den (ganzen) Inhalt der Gleichungen verstehen. Es geht mir nur darum, zu zeigen, dass es eine mathematische Verbindung zwischen den oben genannten Begriffen gibt. Das Interessante hieran ist: Diese mathematische Beziehung fĂŒhrt eine neue Funktion ein (das „F“ im „dF/dt“ auf der rechten Seite), welche die „alten“ mathematischen Objekte {q, p, H(q, p, t)} mit den „neuen“ Informationen {Q, P, K(Q, P, t)} verbindet. Die Funktion F, welche plötzlich aufgetaucht ist, ist im Prinzip ziemlich beliebig: Sie kann sowohl von den alten kanonischen Variablen {q, p} als auch von den neuen {Q, P} abhĂ€ngen, oder sogar von einer Mischung aus den beiden, bspw. F(q, Q, t).

Warum ist das ĂŒberhaupt wichtig?

Falls die Funktion F eine „Mischung“ der kanonischen Variablen ist (zur HĂ€lfte neu, zur HĂ€lfte alt), kann diese Funktion als „BrĂŒcke“ zwischen den kanonischen Variablen {q, p} und {Q, P} agieren. In solch einem Fall kann diese Funktion die kanonische Transformation sogar liefern. Aus diesem Grund heißt sie die „Erzeugende“. Sie erzeugt eben die kanonische Transformation.

Erzeugende Funktionen sind in der Mathematik sehr mÀchtig. Die wichtigste Idee in diesem Beitrag zu den kanonischen Transformationen ist, dass es eine Funktion gibt, welche (a) teilweise aus den alten und teilweise aus den neuen kanonischen Koordinaten abhÀngig ist und (b) damit die kanonische Transformation zwischen den beiden Beschreibungen angibt.

Auf der rechten Seite der Gleichung

p dq/dt - H(q, p, t) = P dQ/dt - K(Q, P, t) + dF/dt

gibt es die totale Ableitung der Funktion F nach der Zeit t. Wie man in der multidimensionalen Analysis lernt (#HöhereMathematik), kann man die totale Ableitung mittels der Kettenregel umschreiben. Zum Beispiel lautet die totale Ableitung der Funktion F = F(q, Q, t):

dF/dt = ∂F/dt + ∂F/∂q dq/dt + ∂F/∂Q dQ/dt.

Setzt man dies in die obere Gleichung, bekommt man

p dq/dt - H(q, p, t) = P dQ/dt - K(Q, P, t) + ∂F/dt + ∂F/∂q dq/dt + ∂F/∂Q dQ/dt.

Dieser mathematische Ausdruck ist eine IdentitÀt. Er liefert mehrere Informationen: Die alten Koordinaten q und die neuen Koordinaten Q sind unabhÀngig voneinander (sie sind ja Teil von zwei getrennten Koordinatensystemen). Daraus ergibt sich, dass man die Terme mit dq/dt und dQ/dt jeweils aus der linken und rechten Seite gleichsetzen kann. Mit anderen Worten: Ein Koeffizientenvergleich liefert die Beziehungen:

p = ∂F/∂q

P = - ∂F/∂Q

und

K = H + ∂F/∂t.

Der erste dieser drei AusdrĂŒcke ergibt sich aus dem Vergleich der Koeffiziente mit dq/dt, der zweite aus dem Vergelich fĂŒr dQ/dt und der dritte ist das, was danach noch bleibt.

Die ersten beiden Formeln (p = ∂F/∂q und P = - ∂F/∂Q) zeigen ziemlich genau den Grund, warum die Funktion F die Erzeugende heißt. Die kanonischen Variablen p bzw. P ergeben sich jeweils als partielle Ableitungen der Erzeugenden nach den kanonischen Variablen q bzw. Q. Kennt man die Funktion F(q, Q, t), so erzeugt diese Funktion die Formeln fĂŒr p = p(q, Q, t) und P = P(q, Q, t). Diese Funktionen können im Prinzip umgeschrieben (invertiert) werden, um daraus die kanonischen Transformationen {q, p} -> {Q, P} zu bekommen. Dies bedeutet nur, dass man am Ende die Funktionen Q = Q(q, p, t) und P = P(q, p, t) hat. Abgesehen von den ganzen komischen Zeichen in diesem Absatz, ist die Idee hierbei lediglich, dass alleine die mathematische Funktion F alle restlichen Informationen liefert. Die Funktion F liefert die kanonischen Transformationen und sie liefert auch die Verbindung zwischen den Hamilton-Funktionen H und K, nĂ€mlich die Formel

K = H + ∂F/∂t.

Und was hat das jetzt ĂŒberhaupt mit der Hamilton-Jacobi-Gleichung zu tun?

Die Hamilton-Jacobi-Gleichung ergibt sich aus einer ganz konkreten Erzeugenden, nĂ€mlich aus der Funktion F, welche die mathematische AbhĂ€ngigkeit F(q, P, t) hat. Diese Funktion wird dann auch noch mit S statt F notiert. Die letzte Formel wird dann folgendermaßen geschrieben:

K = H + ∂S/∂t.

Außerdem wird in diesem konkreten Fall gefordert, dass die Erzeugende eine kanonische Transformation auf Ruhe darstellt. Mit anderen Worten: Man interessiert sich nun fĂŒr eine kanonische Transformation (q, p) -> {Q, P}, welche statt variable Werte {Q, P}, Konstanten liefert. Üblicherweise werden an dieser Stelle die physikalischen Anfangsbedingungen des Problems gewĂ€hlt, also die anfĂ€nglichen Positionen und Geschwindigkeiten eines mechanischen bzw. physikalischen Systems. Da man nun im neuen Koordinatensystem keine Variablen, sondern Konstanten hat, Ă€ndert sich der Wert der neuen Hamilton-Funktion K nicht. Der Wert von K in diesem Koordinatensystem der anfĂ€nglichen Bedingungen ist also konstant. Die konkrete Wahl K=0 liefert:

0 = H + ∂S/∂t.

Nun ist H eine Funktion H(q, p, t). Außerdem gilt fĂŒr die Funktion S(q, Q, t) die Beziehung p = ∂S/∂q (wie man mathematisch zeigen kann). Daraus ergibt sich:

0 = H(q, ∂S/∂q, t) + ∂S/∂t.

Das ist die Hamilton-Jacobi-Gleichung 🎉.

So, ich bin fertig 🛌.

Bis jetzt war dieser Text wirklich sehr abstrakt und schwierig. Eigentlich ist es, denke ich, der schlimmste Text, den ich bis jetzt hier veröffentlicht habe. Das weiß ich. Die nĂ€chsten Texte werden wieder „normal“.

2