Header Code

Czy zasada nieoznaczoności Heisenberga jest spełniona dla dowolnej funkcji falowej?

Chociaż obecnie nie omawia się na lekcjach fizyki w szkole średniej, nawet na poziomie rozszerzonym, zasady nieoznaczoności Heisenberga, to można spotkać w czasopismach popularnonaukowych artykuły starające się przybliżyć to zagadnienie.

Jako przykład może posłużyć artykuł “Wokół zasady nieoznaczoności” Jana Chwedeńczuka [1]. Informuje on czytelnika, iż powszechnie uznane i nie budzące kontrowersji sformułowanie zasady nieoznaczoności Heisenberga mówi, że nie można przygotować cząstki w takim stanie kwantowym, by zarówno jej położenie, jak i pęd były określone, a następnie przedstawia eksperyment myślowy wyjaśniający istotę zagadnienia.

Jednak załóżmy, że nasz czytelnik (młody) zna już rachunek różniczkowo-całkowy i mówi, że go to nie przekonuje, że chce zobaczyć rachunki matematyczne. Co możemy mu wówczas zaproponować?

Można zaryzykować tezę, że każdy “porządny” podręcznik mechaniki kwantowej dla studentów, taki jak [2-3,6-8] zawiera elementarny dowód zasady nieoznaczoności.

Jednak jak się dobrze przyjrzeć taki dowód zawiera nie tylko jawne założenie, że funkcja falowa jest całkowalna w kwadracie, ale także domyślne założenia, że operatory są hermitowskie, a ich wartości własne są rzeczywiste.

Jak pokażę to dalej nie dla każdej funkcji falowej założenia te są spełnione. A zatem dla niektórych stanów kwantowych układu fizycznego nie da się udowodnić spełnienia zasady nieoznaczoności. Tak więc znika obraz tej zasady jako powszechnie obowiązującego prawa fizyki. Co gorsza nie tylko laikom, ale nawet studentom fizyki nie podaje się tej informacji. Celem mojego artykułu jest właśnie zwrócenie uwagi na tą “piętę achillesową” zasady Heisenberga.

Wybrane pojęcia z podstaw mechaniki kwantowej

Jako literaturę uzupełniającą do tego fragmentu naszego artykułu polecamy stosunkowo nowy podręcznik mechaniki kwantowej S. Szpikowskiego [2] oraz szeroko znane pozycje L. Schiffa [3] i P. Diraca [4]. Ponadto zakładamy, że czytelnik zna już treść naszego artykułu Co to jest funkcja falowa i po co jej używamy?.

W mechanice kwantowej każda wielkość fizyczna jest reprezentowana przez operator. Dla ruchu cząstki wzdłuż osi x jej operator pędu to

operator pędu

Aby poznać wartość pędu cząstki należy tym operatorem zadziałać na funkcję falową (wektor stanu) cząstki zgodnie z poniższym równaniem, zwanym równaniem własnym operatora, w którym wartość pędu ma być stałą wartością p

równanie własne operatora pędu

Jest to równanie różniczkowe (1), którego rozwiązaniem jest funkcja falowa następującej postaci

funkcja falowa cząstki o stałej wartości pędu

Jeżeli ta funkcja falowa, miałaby mieć interpretację probabilistyczną (2), to całka po całej przestrzeni z jej kwadratu modułu, tj. |ψ|2 = ψ*ψ powinna dać się unormować (3) do 1. Jednak tu kwadrat modułu jest stale równy 1, a stąd wartość takiej całki to +∞. Stąd podzielenie takiej funkcji przez dowolną stałą nie ma wpływu na wartość takiej całki. Stawia to pod znakiem zapytania tezę, że taka funkcja falowa (4) może być nośnikiem informacji o prawdopodobieństwie zajścia jakiegoś procesu fizycznego .

Funkcja delta Diraca

Paul Dirac pracując nad problemem funkcji falowych mających widmo ciągłe (5) wprowadził pojęcie funkcji δ(x), zwanej później deltą Diraca. Z definicji ma ona następujące własności:

definicja delty diraca 1

dla x ≠ 0 oraz

definicja delty diraca 2

dla przedziału całkowania obejmującego położenie x = 0.

Jak podają podręczniki [2-3] (a także inne podręczniki mechaniki kwantowej), przy pomocy tej funkcji da się wyrazić związki ortogonalności (6) funkcji falowych (3) jako

relacja ortogonalności wyrażona deltą Diraca

Jednak to nie oznacza, że równanie (5) jest tożsame z nadaniem funkcjom (3) interpretacji probabilistycznej (7). Aby tak było ∫ψ(x)*ψ(x)dx musi być równa liczbie, a nie funkcji, bo prawdopodobieństwo jest liczbą z przedziału <0,1>.

Jak można przeczytać w [3] Dirac wyobrażał sobie, że δ(x) to funkcja wszędzie równa 0 za wyjątkiem małego przedziału o długości ε otaczającego początek układu x = 0, gdzie w tym przedziale jest ona na tyle duża, że jej całka po tym przedziale jest równa 1.

Wyjaśniał dalej, że jest to funkcja niewłaściwa, czyli coś bardziej ogólnego niż zwykła funkcja, że może być stosowana tylko w pewnym typie wyrażeń, aby nie doszło do niespójności, nielogiczności teorii.

W szczególności wskazywał, że podstawowym jej zastosowaniem powinny być wyrażenia postaci

zastosowanie delty diraca

gdzie δ(x) występuje jako wyrażenie podcałkowe. Zatem równości typu (5) powinny mieć zastosowanie pod znakiem całki (8), a nie być interpretowane jako wyrażenia samodzielne.

Reasumując uważamy, że funkcje falowe postaci (3) nie mają interpretacji probabilistycznej i przy ich pomocy nie można obliczyć prawdopodobieństwa znalezienia cząstki o pędzie px w położeniu x. Dokładniejsze nasze poglądy na interpretację tych funkcji falowych zawarliśmy w artykułach “Czy cząstka kwantowa może poruszać się klasycznym torem ruchu? – część 1część 2“.

Sformułowanie zasady nieoznaczoności

Oczywiście nie będziemy tutaj przytaczać pełnych rachunków prowadzących do sformułowania zasady nieoznaczoności, ale zacytujemy najważniejsze elementy dowodu oparte głównie na [2], paragraf 2.3.5.

Wartość oczekiwana ā (względnie średnia pomiarów), pewnej wielkości fizycznej, którą reprezentuje operator Â, dla stanu układu opisanego unormowaną funkcją falową ψ jest dana jako

wartość oczekiwana operatora A

Załóżmy, że mamy jeszcze jeden operator Ô, niekomutujący (9) z operatorem Â. Jego wartość oczekiwana ō w stanie ψ, to oczywiście

wartość oczekiwana operatora O

Niech ψ będzie dowolną unormowaną funkcją falową, ale założymy, że w ogólności nie jest ona funkcją własną któregokolwiek z operatorów  lub Ô. W tym stanie, dla każdego z powyższych operatorów można zdefiniować uśredniony po wszystkich pomiarach kwadrat odchylenia pomiarów od wartości średniej. Będą to wielkości odpowiednio dane wzorami

uśredniony po wszystkich pomiarach kwadrat odchylenia pomiarów od wartości średniej dla operatora A

oraz

uśredniony po wszystkich pomiarach kwadrat odchylenia pomiarów od wartości średniej dla operatora O

Będziemy szukać ograniczenia od dołu iloczynu “rozrzutów” pomiarów wielkości fizycznych reprezentowanych przez te dwa niekomutujące operatory tj. iloczynu (Δa)2 ·(Δo)2.

Rozwiązaniem jest lemat, który mówi, że dla dowolnych dwóch funkcji u i v całkowalnych w kwadracie zachodzi następująca nierówność

konsekwencja z nierówności Schwarza-Buniakowskiego

Jeżeli za funkcje uv przyjmiemy u = (Â-ā)ψ ,v = i(Ô-ō)ψ  i podstawimy je do (11), to po wykonaniu kilku przekształceń otrzymamy, że

sformułowanie całkowe zasady nieoznaczoności

W kolejnych częściach naszego artykułu będziemy analizować wnioski wypływające ze wzoru (12) po zastosowaniu go do wybranej funkcji falowej oraz konkretnej pary niekomutujących operatorów.

Zasada nieoznaczoności a atom wodoru

Poszukiwanie funkcji falowych opisujących zachowanie się elektronu w atomie wodoru to zagadnienie dwóch ciał, kwantowy analog klasycznego problemu dwóch ciał (10). Zagadnienie to rozwiązuje się w układzie współrzędnych kulistych §14 w [3]. Rozwiązanie ma wówczas postać unlm(r,θ,φ) = Rn,l(r) · Ylm(θ,φ), §16 w [3].

Radialna część funkcji falowej to Rn,l(r) = e-ρ/2 ρl L2l+1n+l(ρ),
gdzie ρ = 2Zr/na0, a0 = ħ2/μe2, L2l+1n+l(ρ) – stowarzyszone wielomiany Laguerre’a, a μ to masa zredukowana układu jądro – elektron.

Z kolei Yl,m(θ,φ) = (-1)m[(2l+1)(l-|m|)!/4π(l+|m|)!]1/2 Plm(cosθ) eimφ, gdzie Plm(cosθ) to wielomiany Legendre’a.

Interesować nas będą własności stanu 1s, w którym n = 1, l = 0, m = 0. Wówczas, stosując oznaczenia z [3], funkcja falowa tego stanu to
u1,0,0 = (πa30)-1/2 e-r/a0. Jak można w prosty sposób sprawdzić funkcja ta istotnie jest unormowana (11).

W tym momencie możemy już przystąpić do sprawdzenia słuszności zasady nieoznaczoności dla wybranej pary operatorów w stanie 1s. Operator pędu we współrzędnych sferycznych ma postać (przykład 1b, §14.107 w [9])

operator pędu we współrzędnych sferycznych

Natomiast operator położenia w tych samych współrzędnych to

operator położenia

Komutator r-tych składowych tych operatorów łatwo policzyć pamiętając, że on także jest operatorem, a więc powinien być obliczany podczas działania na funkcję falową. Jest on równy

komutator r-tych składowych operatorów pędu i położenia

Prawa strona wzoru (12), po uwzględnieniu, że interesującym nas komutatorem jest (15), który działa na stan u1,0,0 jest równa

kwadrat wartości komutatora pędu i położenia radialnego działający na stan 1s

Aby obliczyć lewą stronę (12) przy tych samych założeniach będziemy musieli policzyć wartości oczekiwane r-tych składowych operatorów położenia i pędu oraz ich kwadratów. W przypadku operatora położenia mamy (12):

wartości oczekiwane potęg r-tej składowej operatora położenia

Wartość oczekiwana pędu radialnego to (13)

wartość oczekiwana pędu radialnego - część 1

wartość oczekiwana pędu radialnego - część 2

Nie powinno zatem ulegać wątpliwości, że wartość oczekiwana operatora kwadratu pędu radialnego jest równa -ħ2/(a0)2.

Jak pokazuje elementarny rachunek,  uśredniony po wszystkich pomiarach kwadrat odchylenia pomiarów od wartości średniej dla operatora pędu radialnego jest równy 0 (14), natomiast ta sama wielkość dla operatora położenia radialnego jest równa 3a02/4  (15).

Podstawiając wyniki obliczeń do (12), wstawiając jawnie a0 (16) otrzymujemy

czy zasada nieoznaczoności jest spełniona w tym przypadku

skąd widzimy, że zasada nieoznaczoności w tym przypadku nie zachodzi.

Zasada nieoznaczoności a cząstka swobodna

Podsumowanie


(1) Jest to najprostsze równanie różniczkowe zwane liniowym jednorodnym. Metody jego rozwiązywania uczy się w szkole średniej na matematyce, przynajmniej na poziomie rozszerzonym.

(2) Interpretacja probabilistyczna (statystyczna) funkcji falowej zakłada, że ψ(x)*ψ(x) jest gęstością prawdopodobieństwa położenia cząstki w punkcie x, a ψ(x)*ψ(x)dx jest prawdopodobieństwem znalezienia cząstki w przedziale dx wokół położenia x. Sumując (całkując) prawdopodobieństwa po wszystkich dopuszczalnych położeniach musimy dostać pewność, czyli 1. Wyraża to ideę, że cząstka istnieje.

(3) Załóżmy, że całka ∫ψ(x)*ψ(x)dx nie jest równa 1, ale jest skończona i równa a2. Wtedy przyjmując podstawienie ψ1(x) = ψ(x)/a otrzymujemy nową funkcję falową ψ1(x), która już spełnia warunek ∫ψ1(x)*ψ1(x)dx = 1. Co więcej taka funkcja również spełnia równanie własne (2) do tej samej wartości własnej.

(4) Mimo niespełniania warunku normowalności do 1 jest to nadal funkcja falowa, bo spełnia równanie (2), a ponadto może poprawnie opisywać np. zjawisko interferencji.

(5) Przykładem funkcji falowej mającej widmo ciągłe jest właśnie (3). Zbiór dopuszczalnych wartości pędu (a co za tym idzie i energii) tej funkcji jest tożsamy ze zbiorem liczb rzeczywistych. Przeciwieństwem jest funkcja falowa mająca widmo dyskretne. Są nimi np. funkcje falowe elektronu w stanie związanym w atomie wodoru, bo odpowiadające im dopuszczalne wartości energii (atomu wodoru) można ponumerować kolejnymi liczbami naturalnymi.

(6) Z lekcji matematyki i fizyki w szkole średniej powinieneś pamiętać, że dwa wektory są do siebie prostopadłe, gdy ich iloczyn skalarny jest równy 0. Natomiast iloczyn skalarny wektora samego ze sobą to kwadrat jego długości.

Dla dowolnych funkcji falowych φ(x) i ψ(x) też da się zdefiniować iloczyn skalarny. Jest to wyrażenie oznaczane jako <φ|ψ> i równe ∫φ*(x)ψ(x)dx. Jeżeli <φ|ψ> = 0, to mówimy, że dwie funkcje falowe są do siebie ortogonalne (prostopadłe), a kiedy <ψ|ψ> = 1, to mówimy, że funkcja falowa jest unormowana. Jeden wzór matematyczny łączący te obie własności nazywamy związkiem ortonormalności.

(7) Jako ilustrację trudności z nadaniem funkcjom (3) interpretacji probabilistycznej zacytujmy dwóch autorów.

S. Szpikowski na stronie 47 w [2] pisze:
“Równość (2.28) pokazuje, że funkcje własne operatora położenia są ortogonalne. Natomiast, zamiast unormowania do funkcji δ Kroneckera, otrzymaliśmy „unormowanie” do funkcji δ Diraca. Takie „unormowanie” będzie występowało wszędzie tam, gdzie widmo wartości własnych będzie widmem ciągłym.
Cudzysłów „unormowania” ma podkreślać fakt, że nie można tu mówić o właściwym unormowaniu prowadzącym zawsze do wektorów o jednostkowej długości. Wynik (2.28) pokazuje, że funkcje własne ψ (2.27) są „wektorami” o nieskończonej długości, a więc nie mogą być elementami przestrzeni Hilberta.

Z kolei A. Dawydow na stronie 42 w [6] pisze:
“Być może, nienormalizowalność funkcji własnych

(∫|ψF(ξ)|2dξ=∞)

operatorów o widmie ciągłym jest związana właśnie z tym, że odpowiednich stanów nie można urzeczywistnić. Praktycznie można urzeczywistnić tylko takie stany, w których wartość F leży w pewnym przedziale F, F+ΔF. Stany takie są opisywane pakietami fal typu (10.7), które można normować. “

(8) Jest to z pewnością doskonałe narzędzie do prowadzenia obliczeń w relatywistycznym rachunku zaburzeń powstałym przy pomocy teorii propagatorów [5], gdzie pozwala to na łatwe wyrażenie zasady zachowania czteropędu w języku funkcji falowych.

(9) Dla dwóch operatorów  i Ô można zdefiniować trzeci operator zwany ich komutatorem [Â,Ô] w ten sposób, że z definicji jest on równy [Â,Ô] = ÂÔ-ÔÂ. Jeżeli komutator jest równy 0, to mówimy, że operatory ze sobą komutują. Dla bezpieczeństwa wartość komutatora należy obliczać zawsze w działaniu na jakąś funkcję falową.

(10) .

(11) Dowód, że stan 1s jest unormowany.

(12) Obliczenie wartości oczekiwanych dla operatora położenia.

(13) Należy się tu dygresja. Jak dowodzi się np. w [7] §6.3. operator pędu jest operatorem hermitowskim, a więc powinien mieć rzeczywiste wartości własne (a nie urojone). Gdzie tkwi “błąd”?

Powyższy dowód jest oparty na tym, że równanie własne operatora i równanie do niego sprzężone dają tę samą wartość własną. Tak jest dla funkcji falowych zespolonych, których wewnętrzna zmienna jest urojona (patrz funkcje własne operatora pędu do rzeczywistej wartości własnej). Tak naprawdę operator pędu jest hermitowski tylko dla zespolonych funkcji falowych, dla rzeczywistych jest skośnie hermitowski i daje wtedy wartości własne urojone. Rozwiązując równanie własne (2) milcząco założyliśmy, że wartości własne są rzeczywiste.  

Powstaje oczywiście pytanie jaki jest sens fizyczny urojonej wartości własnej operatora pędu? Przestrzegalibyśmy przed przyjęciem, że jest po prostu równa 0, albowiem np. wartość momentu pędu (a raczej pierwiastek kwadratowy z wartości własnej operatora kwadratu momentu pędu) w stanie u1,0,0 jest właśnie równy 0. Naszym zdaniem najprawdopodobniej należy przyjąć, że pęd radialny w tym stanie jest nieokreślony. Jak wskazaliśmy w artykule  Czy wszystko już wiemy o związanych stanach stacjonarnych? – Część 3 pęd radialny dla elektronu w polu Coulomba nie komutuje z hamiltonianiem, zatem nie jest tutaj całką ruchu.

(14)Obliczenia – uśredniony po wszystkich pomiarach kwadrat odchylenia pomiarów od wartości średniej dla operatora pędu radialnego.

(15) Obliczenia – uśredniony po wszystkich pomiarach kwadrat odchylenia pomiarów od wartości średniej dla operatora położenia radialnego.

(16) Masa zredukowana układu jądro-elektron, to μ = mj⋅me/(mj+me), patrz §16 w [3].

Literatura

[1] J. Chwedeńczuk – Wokół zasady nieoznaczoności, Delta 10/2017.
[2] S. Szpikowski, Podstawy Mechaniki Kwantowej, WUMCS, Lublin 2011.
[3] L. Schiff, Mechanika kwantowa, PWN, Warszawa, 1977.
[4] P. A. M. Dirac, The Principles of Quantum Mechanics, Pergamon, Oxford, 1958.
[5] J. D. Bjorken, S. D. Drell, Realtywistyczna teoria kwantów, PWN, Warszawa, 1985.
[6] A. Dawydow, Mechanika kwantowa, PWN, Warszawa 1969,
[7] B. Średniawa, Mechanika kwantowa, PWN, Warszawa 1981,
[8] D. Błochincew, Podstawy mechaniki kwantowej, PWN, Warszawa 1954,
[9] E. Karaśkiewicz, Zarys teorii wektorów i tensorów, PWN, Warszawa 1974.

Luka w podręczniku Bjorkena i Drella

Analizując wyprowadzenie operacji sprzężenia ładunkowego na podstawie §5.2. Relatywistycznej Mechaniki Kwantowej J.D.Bjorkena i S.D.Drella można zauważyć, że przeprowadzone tam obliczenia zawierają poważną lukę.

Przypomnijmy, że wychodząc z założenia, iż dziura w morzu stanów elektronowych (dla których e =-|e|) o ujemnej energii jest równoważna obecności pozytonu (dla którego e =+|e|) o dodatniej energii poszukujemy operatora, dzięki któremu będziemy mogli wzajemnie jednoznacznie przekształcać rozwiązania o ujemnej energii równania Diraca dla elektronu w rozwiązania o dodatniej energii dla pozytonu i na odwrót. Dopiero znalezienie takiego operatora będzie dowodem na to, że teoria dziur Diraca ma sens.

O co zatem chodzi? Spójrzmy stąd na równanie Diraca w najogólniejszej postaci (w notacji stosowanej w podręczniku Bjorkena, Drella)

równanie

W tym równaniu zmieniamy pole elektromagnetyczne poprzez zmianę postaci funkcjonalnej potencjałów wektorowego i skalarnego.

Fizycy, wystarczy poczytać trochę literatury, przyzwyczaili się z niezrozumiałych powodów nazywać każde równanie powstałe z równania Diraca dla swobodnych cząstek poprzez wstawienie do niego odpowiedniego pola elektromagnetycznego też równaniem Diraca w tym odpowiednim polu i bezwiednie przenosić na niego własności równania swobodnego.

Jednak dla każdego z tych różnych pól elektromagnetycznych otrzymujemy inny problem matematyczny. Zatem za każdym razem powinniśmy się upewnić, że dane równanie posiada te same własności co i równanie swobodne.

Czasami jest to niezmiernie trudne lub po prostu się to jeszcze nikomu nie udało. Jest to spowodowane tym, że nie istnieje ścisła teoria równań różniczkowych cząstkowych dla zmiennych zespolonych i tak naprawdę konieczne jest każdorazowe rozwiązanie równania Diraca.

Jeżeli chodzi o sprzężenie ładunkowe, to istotnym jest upewnienie się, że zarówno równanie Diraca dla elektronu, jak i dla pozytonu w odpowiednim polu posiada zarówno rozwiązania o dodatniej, jak i ujemnej energii. Autorzy wspomnianego wyżej podręcznika akademickiego nie dość, że tego nie zrobili, to nawet o tym problemie nie wspomnieli.

W tej sytuacji moim obowiązkiem jest wskazanie, że udało się udowodnić, iż w jednorodnym polu elektrycznym (Quasi-klasyczna interpretacja rozwiązań równania Diraca w jednorodnym polu elektrycznym) dla elektronu (jeśli chodzi o pozyton, to nietrudno wykazać to samo) istnieje tylko jedno rozwiązanie, którego wartość własna energii może przyjmować wartości zarówno dodatnie, jak i ujemne.

Chociaż okazuje się, że na tych rozwiązaniach operacja sprzężenia ładunkowego działa, czyli zamienia jedne rozwiązania w inne to jednak w wyniku powyższego otrzymujemy niejasną sytuację co do interpretacji fizycznej tej operacji.

Zachęcam zatem do dyskusji o lukach i wadach podręczników do fizyki na dowolnym poziomie kształcenia.

LITERATURA

  1. J. D. Bjorken, S. D. Drell, Relatywistyczna teoria kwantów, Część I. Relatywistyczna mechanika kwantowa, PWN, W-wa 1985.

Jak Erwin Schrödinger wyprowadził swoje słynne równanie?

Jeśli ktoś chciałby poznać autorskie wyprowadzenie (1) równania Schrödingera poprzez po prostu zajrzenie do jakiegoś podręcznika mechaniki kwantowej, to spotka go przykre rozczarowanie. Źródła te prezentują różne wyprowadzenia, ale mają one niewiele wspólnego z tym oryginalnym zawartym w [5]-[8].

Zanim przejdę do sedna problemu warto pokrótce przypomnieć jak w ogóle powstała mechanika kwantowa.

§.1 Kiedy powstała mechanika kwantowa?

Za pierwszą udaną próbę wyjaśnienia widma najprostszego z atomów należy przyjąć teorię Nielsa Bohra i rok 1913. Chociaż teoria ta podawała poprawny układ poziomów energetycznych atomu wodoru, to nie była w stanie podać prawdopodobieństw przejść kwantowych między poszczególnymi poziomami. Wynika to z faktu, że mimo wprowadzenia kwantowania orbitalnego momentu pędu elektronu teoria ta nadal była w zasadzie teorią klasyczną, a co najważniejsze nie posługiwała się jakąkolwiek wielkością fizyczną, której można by użyć bezpośrednio do takich obliczeń.

Prawdopodobieństwa przejść kwantowych, to wielkości mierzalne w fizyce atomowej i w tej sytuacji naturalnym były próby poprawienia teorii Bohra lub zbudowania nowej tak, aby podać ich teoretyczne wyjaśnienie. Jak wskazuje Born [1] udane prace w tym zakresie zaczęły się pojawiać w roku 1921, a trzy lata później Born użył po raz pierwszy pojęcia mechanika kwantowa.

§.2 Jak pojawiło się w fizyce pojęcie funkcji falowej?

Pierwszym przełomem była praca Heisenberga [2], w której autor porzucił obraz orbit elektronowych o określonych promieniach i okresach obiegu, czyli zamiast opisywać ruch elektronu w atomie poprzez podawanie współrzędnej położenia jako funkcji czasu r(t), postawił za cel wyznaczenie macierzy amplitud przejść Xmn między poziomami energetycznymi.

Niestety, mimo wielu kolejnych prac chociażby takich fizyków jak Dirac, czy Pauli takie sformułowanie teorii znane jako mechanika macierzowe było zbyt formalne, a przez to mało zrozumiałe. Trudno było bowiem dostrzec jakie własności, na przykład elektronów powodują, że taka zmiana podejścia jest konieczna.

Rozwiązanie wskazał Louis de Broglie [3], który był przekonany, że w przypadku elektronów również zachodzi dualizm falowo-korpuskularny i z każdą taką cząstką można związać falę płaską o skończonej długości zgodnie ze wzorem

długość fali de'Broglie

Davisson i Germer [4] oraz inni udowodnili, że rzeczywiście również każda niefotonowa cząstka elementarna ma własności falowe. Jednak wzór (1) dotyczy tylko cząstek swobodnych, a de Broglie nie opisał własności falowych elektronu związanego w atomie. Ze słów Borna w [1] można wyciągnąć wniosek, że po prostu nikt poza Schrödingerem nie wiedział jak to zrobić.

§.3 Oryginalna myśl Schrödingera

Ponieważ Schrödinger wyszedł od opisu mechaniki klasycznej przy pomocy równania Hamilton-Jacobiego, to tytułem wprowadzenia przedstawię podstawowe wiadomości o tym równaniu [9].

A zatem równanie Hamiltona-Jacobiego, to równanie różniczkowe zawierające pochodne cząstkowe, którego rozwiązaniem jest skalarna funkcja S zwana działaniem. Jeśli dla danego układu mechanicznego znamy postać funkcjonalną działania S, to pędy uogólnione tego układu (w przypadku atomu wodoru, gdy źródłem pola elektrycznego jest tylko potencjał skalarny pęd elektronu jest taki sam jak jego pęd uogólniony) są dane jako funkcje położeń qj i czasu t zgodnie z poniższym wzorem

pęd uogólniony

Równanie Hamiltona-Jacobiego w ogólnym przypadku ma postać

równanie Hamiltona-Jacobiego

gdzie H, to funkcja Hamiltona. W przypadku, gdy ∂H/∂t = 0 funkcja Hamiltona może być energią układu, czyli

energia układu (całkowita, mechaniczna)

gdzie T, to energia kinetyczna układu, a V to energia potencjalna i funkcja działania S może mieć postać

stacjonarna funkcja działania

gdzie h jest pewna stałą. W takiej sytuacji równanie Hamiltona-Jacobiego przyjmuje postać

stacjonarne równanie Hamiltona-Jacobiego

Schrödinger w [1] wyszedł od wzoru (6), gdzie zmienił oznaczenie z h na E i antycypował w ten sposób  fakt, że dopuszczalnych będzie wiele różnych wartości E, które będą tworzyć dozwolone poziomy energetyczne atomu wodoru (2). Dalej wprowadził kolejne własne oryginalne założenia.

Po pierwsze, przyjął on, że funkcja działania S nie jest dalej już niezależną wielkością, a oblicza się ją z innej funkcji ψ według poniższego wzoru (3)

działanie wyrażone poprzez funkcję psi

Stałą K wprowadza się na podstawie analizy wymiarowej i musi ona mieć wymiar działania. Kierując się standardową wiedzą z mechaniki kwantowej przekazywaną na przykład na uniwersyteckim wykładzie Mechanika Kwantowa I odwróćmy wzór (7) i mamy, że powinno być

"klasyczna" funkcja falowa

Nie ulega wątpliwości, że Schrödingera funkcja ψ to obecna funkcja falowa, a stała K powinna być równa ħ/i. W ten sposób pęd uogólniony jest dany wzorem

pęd uogólniony wyrażony poprzez psi

Natomiast równanie (6) staje się równaniem na funkcję ψ. Dla zagadnień nierelatywistycznych energia kinetyczna w funkcji Hamiltona jest kwadratową funkcją pędu (patrz [9]) i równanie (6) w wersji energii potencjalnej dla atomu wodoru, po niewielkim przekształceniu przyjmie postać

równanie Hamiltona-Jacobiego wyrażone poprzez "klasyczną" funkcje falową

gdzie e = ładunek elektryczny, m = masa elektronu, r2 = x2 + y2 + z2. Do tego momentu funkcja ψ będąca rozwiązaniem równania (10) powinna dawać tą samą funkcję działania S, która wynika z równania (6).

Dalsze rachunki Schrödinger przeprowadził zakładając, że funkcja ψ jest wszędzie rzeczywista, jednowartościowa, skończona, różniczkowalna w sposób ciągły do drugiego rzędu.

Wyrażenie po lewej stronie równania (10) uznał za osobną wielkość fizyczną. Dlatego oznaczymy je jako funkcję Z, która jest zależna od ψ oraz jej pochodnych położeniowych ∂ψ/∂xj

gęstość działania wyrażona poprzez "klasyczną" funkcję falową

Dalej przyjął, że w przeciwieństwie do mechaniki klasycznej w mechanice kwantowej ta funkcja nie musi być równa 0, a dozwolone wartości tego wyrażenia, a tym samym dozwolone postacie funkcji ψ należy wyznaczyć inaczej.

Funkcję Z (11) uznał za pewnego rodzaju gęstość zależną od położenia i scałkował ją po całej dostępnej przestrzeni (4). Tak otrzymaną całkę oznaczmy jako J

działanie jako funkcjonał od jeszcze "klasycznej" funkcji falowej

Nie jest ona zwykłą całką, ale funkcją zależną od ψ i jej pochodnych, nazywa się ją funkcjonałem.
W końcu Schrödinger zażądał, aby fizycznie dopuszczalnymi były tylko te funkcje ψ, dla których funkcjonał J przyjmuje wartość ekstremalną. Matematycznie na takie pytania odpowiada rachunek wariacyjny [10], który mówi, po pierwsze, że takie dopuszczalne funkcje ψ muszą być w tym przypadku rozwiązaniami równania postaci

kwantowe równanie Hamiltona-Jacobiego

Oraz po drugie, nie mniej ważne, że funkcje ψ muszą przyjmować wartość 0 na powierzchni otaczającej obszar całkowania (czyli w tym przypadku zerować się w nieskończoności).
Przyglądając się równaniu (13) widzimy, że jest to już praktycznie słynne równanie Schrōdingera znane z wykładów mechaniki kwantowej. Pozostaje tylko wykazać, że K = ħ.

§.4 Podsumowanie

Tak naprawdę Schrödinger w swoich pracach [5]-[8] przedstawił dwa wyprowadzenia swojego równania.

O metodzie, którą tu przedstawiłem, powiedział w [6] “…Ta metoda postępowania nie będzie już rozwijana dalej w tej pracy. Naszym celem było tylko podać tymczasowy, szybki przegląd zewnętrznego związku między równaniem falowym i równaniem Hamiltona-Jacobiego. …”. Nieco szerszą analizę tej metody zawarliśmy w artykule Czy wszystko już wiemy o związanych stanach stacjonarnych? – Część 2, gdzie także zacytowaliśmy pogląd Schrödingera na interpretację funkcji falowej.

Druga metoda rozpoczyna się od przedstawienia związków między mechaniką klasyczną w ujęciu Hamiltona, a optyką geometryczną. Ma ona posłużyć dalej uzasadnieniu, że pożądana postać mechaniki kwantowej powinna cechować się takim związkiem formalnym z mechaniką klasyczną jak optyka falowa z optyką geometryczną. Zainteresowanych odsyłam do [6] lub do mojego artkułu W jaki sposób Schrödinger wyprowadził swoje niestacjonarne równanie?, który jest w pewnym sensie moim autorskim tłumaczeniem artykułu [6].


(1) W Internecie można znaleźć stwierdzenia, że równania Schrödingera nie można wyprowadzić, a można je tylko zapostulować. Jednak lektura tego krótkiego artykułu opartego na pracy [5] powinna Cię przekonać, że przedstawione tutaj rozumowanie Schrödingera można nazwać wyprowadzeniem. Podobnie sądzę, że to samo można orzec o jego rozumowaniu zawartym w pracy [8].

(2) Jeżeli będziemy chcieli, jako przykład rozwiązać równanie Hamiltona-Jacobiego dla ruchu ładunku punktowego e w jednorodnym polu elektrycznym E według klasycznej mechaniki relatywistycznej, to jako stałą h należy przyjąć energię spoczynkową ładunku, czyli mc2.

(3) Schrödinger w pracy [5] nie wyjaśnił dlaczego dokonał takiego podstawienia. Jednak jeśli wrócimy do wprowadzonej przez de Broglie’a postaci funkcji falowej, to można zauważyć, że w przypadku cząstki swobodnej (która jest opisywana falą płaską), jej faza ma postać r-ωt. Biorąc pod uwagę, że kp/ħ oraz ω = E/ħ można dojrzeć, iż faza tej fali to nic innego jak klasyczne działanie swobodnej cząstki podzielone przez ħ. Dlatego sądzę, że Schrödinger dzięki tej obserwacji doszedł do wniosku, że punktem startowym do wyprowadzenia równania kwantowego na funkcję falową powinno być równanie Hamiltona-Jacobiego w którym dokonać należy podstawienia (7).  Następnie uznał, że tak otrzymane równanie dla szczególnej postaci funkcji falowej powinno być również słuszne dla innych funkcji falowych o postaciach niezgodnych ze wzorem (8).  Ale to wynika już z postulatów fizyki jako teorii. Albowiem jeśli funkcja falowa jest wielkością fizyczną (a przynajmniej chcielibyśmy, żeby taką była), to powinno istnieć jedno ogólne równanie na tą wielkość niezależnie od tego, czy cząstka jest swobodna, czy też porusza się w jakimś potencjale V.

(4) Schrödinger w pracy [5] również nie wyjaśnił dlaczego dokonał całkowania zgodnie ze wzorem (12). Aby zrozumieć sens jego postępowania przypomnijmy (patrz np. [11]), że klasyczne działanie to całka po czasie z funkcji Lagrange’a (czyli różnicy energii kinetycznej i potencjalnej) dla klasycznego punktu materialnego, czyli

wzór na klasyczne działanie

Całka jest wykonywana od początkowych położenia i chwili czasu, które są ustalone, do końcowych, które mogą być zmienne. Zakłada się, że funkcja Lagrange’a zależy od czasu oraz od zmiennych położeniowych i ich pochodnych po czasie, ale nie dowolnych, a tylko takich, które wynikają z rzeczywistych równań toru ruchu tego punktu. Zatem również i funkcja Z (11) dla ruchu klasycznego poprzez funkcję falową (7) i jej pochodne, zgodnie ze wzorem (8) zależy tylko od tych położeń i prędkości, które wynikają z toru ruchu tego punktu.

Wykonanie całki z funkcji Z po zmiennych x, y, z, ale nie po czasie t w sposób podany we wzorze (12) oznacza potraktowanie tych zmiennych jako zmiennych niezależnych.  Oznacza to założenie, że położenia xj nie są już jednoznacznymi funkcjami czasu, nie są od niego już w ogóle zależne i mogą przyjmować dowolne wartości, a zatem nie opisują już toru ruchu cząstki. Takie postępowanie oznacza konieczność nadania szczegółowej, w tym oderwanej od pojęcia toru ruchu, interpretacji dla funkcji falowej ψ.

Literatura

  1. Max Born, The statistical interpretation of quantum mechanics, Nobel Lecture, 1954.
  2. Werner Heisenberg, Z. Physik, 33 (1925) 879.
  3. Louis de Broglie, The wave nature of the electron, Nobel Lecture, 1929.
  4. C.J. Davisson, L. H. Germer, Phys. Rev. 30, 707 (1927).
  5. Erwin Schrödinger, Quantisation as a Problem of Proper Value, Part I, Annalen der Physik, 79 (1926) 361.
  6. Erwin Schrödinger, Quantisation as a Problem of Proper Value, Part II, Annalen der Physik, 79 (1926) 489.
  7. Erwin Schrödinger, Quantisation as a Problem of Proper Value, Part III, Annalen der Physik, 80 (1926) 437.
  8. Erwin Schrödinger, Quantisation as a Problem of Proper Value, Part IV, Annalen der Physik, 81 (1926) 109.
  9. W. Rubinowicz, W. Królikowski, Mechanika Teoretyczna, PWN, Warszawa 1978, rozdział III, §3.
  10. I. M. Gelfand, S. W. Fomin, Rachunek Wariacyjny, PWN,Warszawa 1979, rozdział VII, §31.
  11. R. S. Ingarden, A. Jamiołkowski, Mechanika Klasyczna, PWN, Warszawa-Poznań 1980, §15.1.