(本文起始於 2006-07-13,尚在繼續思考與寫作中)
上星期週末,在家裏學著把狄拉克方程自己來推導一次,這時忽然想起,最好有一個地方,能將自己每日在腦中閃現的一些具有哲理思辯的另星思想,隨時地記錄,分門別類地收集歸類,以讓這些一閃而逝的電光石火不再丟失,這樣就開辟了這塊實驗性的場地,如果有更多人有興趣愿意來交流,那一定是沒缺點了。 【一,為什麼薛定諤留下一個方程讓狄拉克去完成】
本文打算從狄拉克方程談起。在尋求物質波所滿足的微分方程時,一下子跑出來了三種方程(只有量子力學才會有這種怪事),它們是:Schrodinger 方程,Gorden-Klein 方程,與 Dirac 方程。重新再把它們再推導一次確可獲得很多想法。
首先這三個微分方程,都是先有一個「數學解」,而且也是一個共同的「數學解」。假設了這樣一個「解」以後,再去反推出微分方程,方法是對那個解進行一次微分與二次微分,然後再用對這些微分的加加減減的組合來形成一個微分方程。所以它是先有解而後有方程的。(而不像其它一些物理理論,或是從某種假設去獨自建立起方程,或是從實驗結果總結出一個方程來。)因為先有解再有方程,自然用同一個解,就能「拼湊」出不止一個方程來,這就是為什麼一下子能跑出三個不同的方程。這是它們的第一個怪異之處。
這個先驗的「數學解」,就是我們通常所說的「波函數」,它是個老面孔,對任何諧波都是一樣的,用復指數來表示就是:
Ψ(波函數) = exp{iω(t - x/c)} (1.1)
這裏 exp 是自然指數的底,i 是虛數符號,ω 是圓頻率,t 表示時間,x 表示位移,c 則是波速。這一波函數的表達式在任何講述簡諧波(水波,聲波)的古典力學的教科書中都有。
所不同的只是,量子理論的創始者們再用德布羅衣公式,將上述公式中的圓頻與波速,用能量或動量來加以替換,變成了:
Ψ = exp{i(Et - px)/h} (1.2)
這裏 E 是能量,p 是動量,h 是 Planck 常數除之以 2π。這便成了一個粒子波的波函數了。有了這一個粒子波的波函數的表達式(解)後,就可以用它來倒推出波函數分別對時間和對三維空間的偏微分(一階或二階)。以上到此為止,並無什麼新鮮的花樣。
問題是怎樣去將這些一階或二階的偏微分,通過加加減減的組合來形成一個微分方程。這種組合不能太復雜(物理學的美學原理),所以它的最簡單的組合,無非就就是以下這樣四種:
1) 波函數 Ψ 對時間 t 的一階微分,配之 Ψ 對空間 x 的二階微分 (1-to-2) 2) 波函數 Ψ 對時間 t 的二階微分,配之 Ψ 對空間 x 的二階微分 (2-to-2) 3) 波函數 Ψ 對時間 t 的一階微分,配之 Ψ 對空間 x 的一階微分 (1-to-1) 4) 波函數 Ψ 對時間 t 的二階微分,配之 Ψ 對空間 x 的一階微分 (2-to-1) (1.3) 首先「拼湊」出方程的是 Schrodinger,他的那個微分方程從此就叫做薛定諤方程,它是屬於以上第一種的組合(1-to-2);然後是 Gorden 與 Klein,它是屬於第二種(2-to-2),最後 Dirac 也「拼湊」出了一個方程,它就是狄拉克方程,它是屬於第三種(1-to-1)。
最初在黑暗的夜色中能想出它們的人,就是天才。而我們現在再來看這些建立它們的過程,覺得幾乎是小兒科,不過如此而已,但我們卻是身處於光明之中啊。後人看前人,很難體會到當初前人的艱辛與得來之不易。
接下來的問題就是如何將以上的「波函數的偏微分」進行「拼湊」了。要將微分量拼成一個方程,首先就要有一個等式,有了等式,就只要將等式兩邊的量用「波函數的偏微分」來替換,那麼所要的微分方程就出來了。
這樣的等式早就有了,它就是「能量與動量的關系式」。在相對論出現之前,經典的能量與動量的關系式是相當簡單的,可以把這個等式寫為:
E = p² /2m +U(r) (1.4)
而有了相對論之後,能量與動量的關系式復雜了一點,但也不是太復雜,它變成了以下的關系式:
E² = m² *c^4 + p² *c² (1.5)
其中 E 是能量,p 是動量,m 是靜質量,c 是光速符號, ^4 表示是四次方,U(r) 是帶電粒子在外場中的勢能。
我們很容易證明(此處略去具體的證明),能量 E 與波函數 Ψ 對時間 t 的偏微分有直接關系(線性的關系),而動量 p 則與波函數 Ψ 對空間 x 的偏微分有直接關系。還不單如此,而且一次方的 E 或 p,與波函數 Ψ 的一階偏微分相關,而二次的 E 或 p,又正好與波函數 Ψ 的二階偏微分相關。這樣,上述兩種「能量與動量的關系式」,就正好對應了前面文中所討論過的兩種不同的組合。
我們先觀察第一個等式(1.4),它左面的能量E是一次方的,而右面的動量p是二次方的。所以它正好可以滿足前文的第一種配對(1-to-2),所以利用它就可以拼裝出薛定諤方程。(但要記住:它是利用了當時已經落伍的「經典的」能量與動量的關系式。)
再觀察第二個等式(1.5),它左面的能量E,與右面的動量p,都是二次方的。所以它正好可以滿足前文的第二種配對方式(2-to-2)。我們在前文已說了,這第二種配對方式,是可以拼裝出戈登-克萊茵方程來的。(但也要記住:它利用的是「相對論的」能量與動量的關系式,這才是能量與動量的最為正確的物理關系。)
但理論與實際的結果都表明:利用經典式(1.4)拼裝出來的 Schrodinger 方程效果極好,而利用相對論式(1.5)拼裝出來的 Gorden-Klein 方程卻不是很令人滿意。以至於 1933 年的諾貝爾物理獎是給了 Schrodinger,而不是 Gorden 與 Klein。這是它們的第二個怪異之處。
薛定諤不可能不清楚這兩個「能量與動量的關系式」的廓優廓劣,薛定諤發表他的方程是在 1926 年,離相對論的誕生已過去了 21 年,此時愛因斯坦的能量動量關系早已為世所公認,而且被各種實驗事實所驗正。它與那個經典的能量動量關系式相比,猶如汽車對上大車。
量子理論的大突破是在 1925-1926 年間(我又要想起這時中國正在準備北伐戰爭)。對物理學家的生平稍作研究就會發現一開始薛定諤也是向那個相對論的能量動量關系上去努力的,而且很有可能他在草稿上先建立起的方程是那個後來所謂的 Gorden-Klein 方程,只是在計算氫原子能級時,與實測能譜並不相符。薛定諤後來在寫給另一物理學家的信中談到:「在相對論的框架內可以給出索末菲精細結構,但由於半整數(而不是整數)的出現,表達式並不準確,我沒有發表這方面的文章,我把這篇文章撤回,代之以論述非相對論的文章。」
1926 年,薛定諤連續寫出了六篇論文,那篇最重要的,也就是包含了薛定諤方程的論文,是其中的第一篇。
最初,薛定諤在向韋爾討教後,終於打開思路,並找到了建立相對論性的 Gorden-Klein 方程的方法,並寫出了論文,但隨之又將它放棄(薛定諤自己的說法)。然後薛定諤就轉向非相對論性方面,也馬上又找到了方程,就又寫了一篇論文,真正發表的是這一篇,也是六篇中的頭一篇。 1926 年 1 月 27 日,物理學年鑒收到了薛定諤的這篇論文。(薛定諤後來對友人談起他撤回過先前那篇建立 Gorden-Klein 方程的論文,但物理學年鑒的歷史檔案卻顯示從未收到過那篇所謂被撤回的論文,後來人們研究薛定諤的筆記本時,亦未能發現有關建立 Gorden-Klein 方程方面的手稿)
薛定諤方程問世後,經過了嚴格的實驗驗正,它精巧地解釋了量子物理的種種實驗。但是,不論薛定諤方程多麼地成功,總得需要給出一個合理的理由,說明為什麼非相對論性的薛定諤方程,為什麼反而能勝過相對論性的 Gorden-Klein 方程。
而這部份的探索,正是狄拉克所做的工作。
狄拉克理解到 Gorden-Klein 方程必定存在著某種缺點。狄拉克是極少數的喜歡從數學(而不是從模型)去建立物理理論的物理學家,其實從數學的角度來看是很明顯的: Schrodinger 方程與 Gorden-Klein 方程的區別只在於它們使用了不同的動量-能量關系式,因此,比較它們也只需從兩個不同的能量-動量關系式方面來著手。
從數學的角度去比較那兩個動量-能量關系式,你就很容易看出,它們的差別只在能量 E 的方次上面。這兩個表達式的能量與動量的方次,是既有相同處,亦有不同處。相同的是那兩個式子右邊的動量 p 都是二次方的;而不同的只在能量 E 上面:Schrodinger 方程所利用的能量-動量式子中的左邊的能量 E 是呈一次方的( E = p² /2m),而 Gorden-Klein 方程所用的式子中的左邊的能量 E 卻是呈二次方的( E² = m² *c^4 + p² *c² )。
狄拉克想到,它們的關鍵的差異,可能就在於這一能量次方的差別上面了。Schrodinger 方程雖然用了古典的能量-動量關系,但由於能量採用一次方,就效果良好。而 Gorden-Klein 雖然用了正確的相對論能量-動量關系,但由於這關系中的能量是二次方的,所以反而達不到預期的效果。
但是,若要將相對論的能量-動量關系式(E² = m² *c^4 + p² *c²)中左邊的呈二次方的能量 E² 進行數學處理,讓它變成一次方的 E,那麼就需要將等式兩邊都進行開方,成為:
E = sqrt(m² *c^4 + p² *c²) (1.6)
但新的問題又隨之而來了,這樣開方以後,左邊的能量 E 確實是變成了一次方,但右面的式子卻出現了根號。如果根號內是個純數字,當然好辦,但現在它不是一個純數,而是一個表達式。所以問題就又變成為,當左邊能量為一次方之後,如何才能把右邊式子上的那一個根號加以去掉?
前文談到,狄拉克在分析了 Gorden-Klein 方程的缺點後,將問題集中到能否將愛因斯坦的能量-動量關系式的開方式進行「去除根號」的問題。
去根號的辦法在數學上早就有之,當時數學家們所知的對一個表達式(而不是純數字)去除根號的辦法,就是用泰勒公式,將之展開成無窮級數。但再仔細一想,就知道這方法是換湯不換藥。因為這樣的結果只是回到了 Schrodinger 方程。原來,在 Schrodinger 方程那裏所用的那個能量為一次方的經典關系式( E = p² /2m),其實就是將愛因斯坦的能量-動量關系式展開成泰勒級數(Taylor Progression)之後,再略去比二次項更高的高次項而所得到的結果。
所以,在 Schrodinger 的方法中,根號是沒了,能量是呈現一次方了,但代價則是略去了級數中四階以上的高次項(這就是經典關系式)。有人可能會問,哪可不可以不略去那些高次項呢?其實那是更不切合實際了,沒有哪位數學物理學家敢於引進比兩階更高次的微分方程的,何況那還是要直到無窮階,哪就等於是無解。一切自然的法則,既然能成為法則,就不可能是太過複雜的形式。
既然展開成級數的辦法也行不通,哪麼,還有沒有別的更好的辦法?這顯然是個很難的題目(不然諾貝爾獎就也太好得了)。但狄拉克是有數學方面的天才的(他很像麥克斯威),結果終於讓他想出了一個很巧妙的辦法。 繼續侃狄拉克方程。前面說到,問題已集中到能否將愛因斯坦的能量-動量關系式進行開方,但是又不能再沿用傳統的展開成無窮級數的方法。這確實是一個前所未有的困難。但是,狄拉克找到了一個很巧妙的方法,想出這一方法是推導出狄拉克方程的關鍵。
我們先回顧一下愛因斯坦的能量-動量關系式(前面文中已出現過):
E² = m² *c^4 + p² *c² (1.5)
其實這一個等式的右邊部份相當於兩個平方數的和。從數學上講,它可以簡化為代數學中最基本的寫法 a 平方加上 b 平方。即:
E² = m² *c^4 + p² *c² = (m*c² )² + (p*c)² = (a² + b² ) (1.7)
我們很容易看出,(a² + b²)並不是一個完全平方式,它離開完全平方式只差了一個 2ab。就是說,如果再給一個 2ab,它就能配成為完全平方了(因而也就可以開方了),因為:
(a² + 2ab + b² ) = (a + b)² (1.8)
但再仔細地分析這一個代數學中最基本的完全平方式,就會發現還是有一些微妙之處。原來這完全平方(a + b)²,若把它乘出來應該是這樣的:
(a + b)² = (a + b)(a + b) = aa + ab + ba + bb = a² + ab + ba + b² (1.9)
就是說,那一個 2ab 項,原來並不是兩個 ab 加在一起,而是 ab 與 ba 的相加,只是因為初等代數學中的乘法的交換律,所以才有 ab = ba ,從而變成了 2ab。
但那畢竟只是初等代數中的規則,到了矩陣代數中,情況早已不是這樣了,在矩陣代數中,矩陣 A 與 矩陣 B 的乘積是不服從交換律的,就是:
AB ≠ BA ( 我們用 ≠ 表示不等於) AB - BA ≠ 0 AB + BA ≠ 2AB (1.10)
這樣一來,解決的辦法就有了。
狄拉克馬上就想到可以利用矩陣代數來擺脫這一開方困境,既然在矩陣的情況中,矩陣 A 與矩陣 B 的乘積與次序有關,乘積 AB 並不等於 BA,那麼,適當地選取某種系數矩陣 A 與 B,就有可能使得和式 (AB + BA)為零,並且使乘積 AA 與 BB 成為「單位矩陣」,在矩陣代數中,單位矩陣的作用只相當於初等代數中的數字「單位 1 」。
這樣的矩陣是存在的,它有一個名字,叫做厄米矩陣(Hermite matrix)。很快的,狄拉克找來了四個四階的厄米矩陣,用它們來作為「能量-動量關系式」中各分量前的系數。
這裏我們再以上面那種最基本的代數式為例,說明如何利用系數矩陣來達到組成一個完全平方式的目標。試看完全平方式(aA +bB)²,這裏 a 與 b 是數,而 A 與 B 是矩陣。我們把它乘出來看一看:
(aA + bB) ² = (aA +bB)(aA + bB) = aAaA + aAbB + bBaA + bBbB = aaAA + abAB + baBA + bbBB = a² AA + ab(AB + BA) + b² BB (1.11)
前面已談到,選擇適當的厄米矩陣 A 與 B,就可以使得(AB + BA)等於零矩陣,且使 AA 與 BB 成為單位矩陣,從而就有:
(aA +bB)² = a²I + ab0 + b²I = (a² + b² )I (1.12)
這裏I是單位矩陣,它相當於數字單位 1;0是零矩陣,它相當於數字 0。於是我們看到,通常不是完全平方的 (a² + b² ),只要將它乘之以一個單位矩陣,就可以將之配成為一個含有矩陣A與B的完全平方式(因此可以將它開方),這個完全平方式就是 (aA +bB)²。
根據上面的方法,我們就可以將含有E的兩次項的那個愛因斯坦的能量-動量關系式(1.5)(1.7)的右邊進行處理了,那右邊的部份原是一個不完全平方式,我們引入系數矩陣 A與B來將之配方,使其能配成為一個完全平方式:
利用(1.12): (a² + b² )I = (aA +bB)²
結合(1.7):E² = m² *c^4 + p² *c² = (m*c² )² + (p*c)² = (a² + b² ) 便得:
E²I = (a² + b² )I = (aA +bB)² = (m*c² *A + p*c*B)² (1.13)
a與b是為表達方便而引入的中間變量(a = m*c²;b = p*c)。最後得到的完全平方式(1.13)是可以開方的,開方後,左邊的能量E就呈一次方的形式了:
E = m*c² *A + p*c*B (1.14)
這裏E是能量,m是粒子波中粒子的質量,c是光速,p是粒子的動量。而A與B是兩個純系數的厄米矩陣。
於是,在滿足了相對論這一先決條件之下,確實做到了讓能量E呈現為一次項。從而囊括了薛定諤方程與 Gorden-Klein 方程的優越性(但仍不是前者優越性的全部)。
我們由此看出:狄拉克之所以能成功地導出這一方程,最關鍵的地方,就在此種利用厄米矩陣,來將一個不能開方的不完全平方式,化解成可以開方的完全平方式。關鍵的訣竅僅在於此,而狄拉克方程推導中的其餘部份,則都是很簡單的。
寫到這裏,細心的人一定會提出兩個重要的疑問:第一,為什麼必須讓能量E呈現為一次項,即為什麼薛定諤方程與狄拉克方程由於採用了能量E的一次項而取得了成功,而 Gorden-Klein 方程卻因採用了能量E的二次項而不具太大的價值?(注1)
第二,這種引入矩陣的奇怪的方式,是不是只是一種單純的數學手段?還是含有更深層的,根本性的物理含義?(注2)
其實這兩個問題相當有意思,但那些死讀書的學狄拉克方程的人大慨不會去想這種問題。有可能的話,我將在後面對它繼續加以探討。
【二,《海森堡不確定原理》已經被確定了嗎?】
前面談到狄拉克利用了矩陣具有特殊的『乘法交換律』,來解決了開方問題,從而導出了狄拉克方程。這種矩陣才有的『乘法交換律』可以表示如下:
AB ≠ BA ( 我們用 ≠ 表示不等於) AB - BA ≠ 0 AB + BA ≠ 2AB (2.1)
但我們要公平地說一聲,在量子理論的創建過程中,最早引進這種矩陣代數,從而將量子理論引入正途的人,並不是狄拉克,而是海森堡與玻恩。狄拉克只是在推導他的波動方程時,靈機一動,想到了要用上波恩與海森堡早就引進了的這一矩陣咚恪
首先引進矩陣咚悖诹孔永碚撝锌绯隽俗罡锩缘囊徊剑铱淳褪怯刹6魉岢隽四莻曾被稱之為『量子理論基本方程』的矩陣關系式了:
pq – qp = - (ih/2π)*I (2.2)
這裏p是粒子波的動量,q是粒子波的位置座標,h是普朗克常數,i是虛數單位,π 是圓周率,I是單位矩陣。這裏p與q都是矩陣,所以pq減去qp不再是零。不但不是零,而且減出的結果還與普朗克常數有關。這一個基本方程首次將矩陣代數引入了量子理論,並且,我現在已經理解到,正是此項關系式才是真正地揭開了某種當今物理學還未認識到的物理內函(注3)。
了解量子理論歷史的人都知道,是海森堡在 1923-1924 年間想出了用排成陣列的方式來處理原子光譜中的不同的態。那是他才 22-23 歲,先後做過玻恩(格廷根)與波爾(哥本哈根)的助手。但是海森堡當時完全不知道數學中早就有了這一門矩陣代數。
但是海森堡所不知道的這種數學,比他年長廿歲的馬克斯‧玻恩卻在廿年前就在大學時學過了。所以玻恩馬上從海森堡的工作中看出了關鍵所在。1925 年夏天,玻恩與約當一起合寫了一篇完整的論文,在這篇與約當合寫的論文中首次出現了上述關系式(pq – qp = - ih/2π),這方程首次由馬克斯‧玻恩提出並載入他與約當合寫的論文之中。在玻恩與約當一起合作的時候,海森堡以書信的形式也加入其中,最後在 1925 年 10 月,該論文成為一篇著名的『三人文章』,而格廷根的物理學家們將這一關系式強調為『量子力學的基本方程』。
而狄拉克是在 1925 年的夏天,才從海森堡那裏初次獲知了這種矩陣形式的量子理論。狄拉克的大學本科唸的是工程,只是因為畢業後在工程界找不到職位,而劍橋卻給了他去唸應用數學本科的獎學金,因此才又去唸應用數學。應用數學本科畢業後再跟導師褔勒作研究。
狄拉克馬上就走吡耍1925 年 7 月,海森堡來劍橋講課,海森堡把他將要刊出的那篇用非常粗糙的數組方法解決量子問題的論文的副本給了褔勒,狄拉克從他的導師褔勒那裏看到了這份副本。默默無聞,既不出名也沒有經驗的狄拉克,具有數學上的天份,而他比之海森堡甚至玻恩更了解矩陣數學。狄拉克用了數週時間,用他熟知的,在一個世紀以前由哈密頓發展起來的這一數學分枝,將海森堡的方程重新推導了一遍。在導師褔勒的鼓勵下,狄拉克將他的計算寫成論文,於 1925 年 12 月發表,海森堡看到後覺得狄拉克的論文,比自己的那篇論文更精確。
所以整個過程大至是這樣的:海森堡首先想出了用數組(表格)的方式來解決量子問題。因為數組(表格)的優點就是可以讓每一格子之間正好差一個量子。然後玻恩尾隨海森堡,並且引入了矩陣代數這一正確的數學方法。玻恩引入的方法是有效的,但看上去很笨手笨腳。最後,由狄拉克完成的並被稱之為『量子代數』的數學形式,最為完整並且形式優美,這成為後來量子理論教科書中所見到的表述方式。
以上的過程可以讓大家了解到,雖然狄拉克遲至 1928 年才正式用矩陣的方法解開了狄拉克方程的疑難問題,但這種『在量子理論中引進矩陣代數』的關鍵步遽,是早在 1925 年的 7 月 至 12 月間,就已由海森堡、玻恩、狄拉克等三人逐步地引入並加以深化的。但還要了解到一點,他們當時引入矩陣,只是為了解決問題的方便,而不見得已經全部了解到它的物理含義,在他們的引入(pq – qp = - ih/2π)這一重要矩陣方程的論文中,他們並沒有對這一方程作出解釋。(而且我可以說,物理學家們到目前為止都還沒有了解到此矩陣方程的真實含義)
在對量子理論中引入矩陣咚愕臍v史作了前面的一番介紹之後,我們就可以回到早先在談論狄拉克方程時所提出過的那個問題:
『這種引入矩陣的奇怪的方式,是不是只是一種單純的數學手段?還是含有更深層的,根本性的物理含義?』
我在狄拉克方程部份所提出的這個問題,與前述量子理論產生初期所引入的此種矩陣方程,原系同一內函的問題。但是在量子理論取得了巨大的成功之後,人們似乎已不再去思考這一點,或者可能認為它並不是一個問題。這裏面有一個命題是特別有代表性的,那就是海森堡在 1927 年所提出的不確定原理(uncertainty principle)。
1927 年,沃爾納‧海森堡 (W. Heisenberg, 1901-1976)提出了不確定性原理,它的數學形式是:
Δp.Δq <= h (2.3)
其中p是粒子波的動量,q是粒子波的位置,h是普朗克常數, Δp與 Δq表示p與q的一個微小的增量(interval),這裏它正好被用來表示測定p與q時的『不確定性』的程度。
但如果重溫一下量子理論的歷史,我就覺得這一『不確定性原理』似乎有些被本末倒置了。因為它不是什麼『原理』,原理是不能從其它原理或定理去導出的,但海森堡的不確定性原理卻是可以從前面的『量子理論基本方程』來加以導出。這就是說,我們可以從前面談到的那個由玻恩首先提出的矩陣關系式(2.2)來導出不確定性原理的不等式方程式(2.3)。(注4)
關於(2.3)可由(2.2)式來導出這一點,是最清楚明了不過的事。只要按照誤差理論中簡單的數學咚悖恍枰郊尤魏挝锢砑僭O,我們就可以從前一個方程導出後一個不等式方程,這是簡單的數學推導。
我們說了,海森堡的不確定性原理不等式可以由『量子理論基本方程』的矩陣方程來加以導出。但問題還不止於此,真正的問題是:
從玻恩的矩陣方程出發,可以導出海森堡的不確定性不等式。但是反過來做卻不行,從海森堡的不確定性不等式(2.3),就不能導出玻恩的矩陣方程(2.2)。
所以玻恩的矩陣方程(pq – qp = - ih/2π*I)更像是接近了量子的神秘的本質,而海森堡的不確定性原理(Δp.Δq <= h)我覺得不過是玻恩矩陣方程的一個技術性的推論。但問題是『不確定性原理』帶有濃厚的哲學味,它可以挑起人們的無限的暇想,從而使它聲名大噪。這與狹義相對論中的『時間延遲』(或『雙生子佯謬』)也有點相像。
(待續)
|