設萬維讀者為首頁 廣告服務 技術服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:阿飛的劍
萬維讀者網 > 茗香茶語 > 帖子
第九章 數碼羊皮書
送交者: 林教頭 2007年06月28日16:46:22 於 [茗香茶語] 發送悄悄話

阿比蓋爾終於拆開了“羊皮書”,熱維爾和齋藤健對此的回報,是衝破希臘數學思想界限的見識。不過有一點從一開始就很清楚:阿比蓋爾的工作只是讓B先生的書走向徹底變化的一步。當她拆開禱告書時,我要求科學家將禱告書中的所有羊皮紙抄本再放回到一起,就像在1229年之前那樣。

我不是讓科學家複製“羊皮書”;我只是要他們替換它。我希望他們製作的替換品比古抄本要好得多,這樣古典學者就不必專程到巴爾地摩朝聖。我要求他們將看不見的東西變成看得見的,讓全世界的人從電腦上能看到它,讓它看起來整齊有序。阿基米德的文稿當然放在第一,然後是其它古抄本的文稿。這聽起來像烏托邦的幻想。說到底,我們連其它抄本有多少都不知道,就更別提它們的內容啦!但是,我們在2005年獲得的結果超出了所有人的期望:古典學者現在能夠讀到的文稿,在1998年那時連做夢都想不到;他們過去無法從手稿中讀到這些內容,現在他們得從電腦上讀。然而這項成功來之不易,花費了很長時間。

從一開始大家就清楚,兩個科學家小組--比爾·克里斯頓巴里率領的約翰·霍普金斯大學的小組,以及羅切斯特理工學院的羅傑·伊斯頓和基茲·諾克思--主要依賴和使用的工具是所謂的“多光譜成像”技術。我需要理解“多光譜成像”的含義,我的輔導員是他們中間唯一的教授羅傑·伊斯頓,他是羅切斯特理工學院成像科學系的教授。我認為圖像是藝術家創作的不同形狀。羅傑認為圖像是光產生的數字。毫不奇怪,他向我解釋他的觀點花了一些時間。


羅傑告訴我說,不論是來自太陽還是燈泡的光,都是以電磁波的形式,這些電磁波由叫做光子的微小能量包組成。光子可以用它們波峰之間的距離來表徵,也就是它們的波長。某些光子的波長很長,比如無線電波、微波和紅外光波,另一些光子的波長短得多,比如紫外光波、X射線和伽瑪射線。可見光只是整個電磁光譜的一小部分,從紅外到紫外。光子的波長越短,它的能量越高;然而所有的光子在真空中運動的速度都是完全一樣--這就是著名的光速:每秒鐘十八萬六千二百八十二英里(譯者註:約每秒三十萬公里)。

光子和物質相互作用,後者由原子組成。更具體地說,光子和分布在原子核周圍的電子相互作用。並非所有的光子能同所有的電子相互作用:關鍵是這種相互作用取決於它們各自的能量;它們必須相互發生共振。如果是這樣,光子則會改變電子的能量狀態,作為回應電子則會自己發射一個光子。任一指定電子發射的光子會有精確的波長,或者精確的能量,這個波長取決於電子需要放出的能量,而這又取決於電子在原子結構中的位置。

人類的眼睛利用光子來得到彩虹中所有的顏色。這是眼睛工作的原理。藉助眼球的水晶體,眼睛將物體中電子發射的光子聚焦在視網膜的感光細胞上。光子引起這些感光細胞的化學變化。細胞的變化取決於所接收光子的波長:當你的眼細胞接收到波長大約為400納米的光子,它們的變化產生一股電流,通過視神經傳到大腦的視覺中心,後者將電流表示為顏色:藍色。當你的眼細胞接收到波長大約為700納米的光子,同樣的過程又出現,但化學變化有點不同,產生的電流也不同,最後的顏色不一樣。這時,你會看到紅色。我們閱讀的過程,是將大腦視覺中心產生的強度和色彩的圖案辨認識別為字母。問題是,“羊皮書”表層下文字中的很多字母,即使在明亮的陽光下也無法辨認。

“勝過太陽的光源會是什麼樣?”我問羅傑,“勝過眼睛的感光器官會是什麼樣?”太陽作為光源的麻煩是,它發射的是各種各樣波長的光子。陽光下眼睛看到的圖像,是所有可見波長產生的圖像的總和。如果能夠找到一種光源,發射的光波波長只占光譜中很窄一個頻帶或波段(譯者註:波長几乎不變),那麼產生的圖像只攜帶來自那一個波長的信息,而不被其它波長的光覆蓋。

例如,考慮一下紫外燈形成的圖像。雖然這種燈產生的光子波長比眼睛能察覺的要短,它們照在羊皮紙上的效果是顯著可見的。它們將能量傳給羊皮紙中的原子和分子,後者吸收部分能量,並將剩下能量以光子形式重新發射,被發射光子的波長恰好在可見光光譜的藍色波段。當羊皮紙重新發射可見光子時,羊皮紙上的墨跡遮擋這些光子使它們變暗。最後效果是,從這片“熒光”發出的柔和藍光“從背後照亮”了墨跡。表層下模糊文字的對比清晰度增加了,因此文字變得更好辨認。很久以來,古典學者一直用紫外熒光燈閱讀羊皮紙手稿,效果非常好。熱維爾和齋藤健用它來讀過《方法論》一文中第十四命題。但是,除了在暗室之外,紫外燈無法有效使用;其它頻率(波長)的光子完全遮蓋了它的效果。

人眼本身是一件如此令人驚嘆的複雜器官,很難想像一個人造眼可以勝過它。但是眼睛也有很多我們平常不會注意的局限,因為它已經演化並適應我們的日常需求。只不過,當我們想做的事跟平常不同,眼睛的局限才會更加明顯。羅傑解釋道,觀察行星不是容易的事,因為視網膜上的圖像尺寸很小,只覆蓋少數幾個眼睛的感應器(感光細胞)。因為每個感應器“看見”的都是行星的一大部分,眼睛無法看見(“分辨”)很小的細節。這時,望遠鏡就能發揮用途。或者,考慮另外一個問題:我發現天黑後很難看見我的小貓格雷西,因為人的視網膜細胞不會對溫血動物身體發出的波長有反應;這些紅外波長比我們可見光光線的波長大很多。人類眼睛只對電磁光譜的很小一部分有反應。但是現代攝像機能夠探測到紅外線波長,發現黑暗中的溫血動物。這就是我們為什麼用攝像機,而不是眼睛,來讀“羊皮書”的根本原因。現代攝像機跟人眼不一樣,它們對可見光光譜之外的光也敏感,所以它們能夠“看見”令人眼變“盲”的信息。

簡而言之,當你使用窄帶頻寬照明並用相機進行捕獲,你得到的結果跟你在陽光下觀看對象的結果可能完全不一樣。攝影者在不同窄帶照明條件下使用相機揭示隱藏的秘密文字,在世界各地都取得了顯著的成功。例如,楊百翰大學一個小組研究了公元79年8月24日星期二午後不久爆發的維蘇威火山的遺蹟,對埋在赫庫蘭尼姆古城火山灰下炭化的圖書館卷書進行成像,取得了非凡的結果。在普通光之下,很多卷書上根本看不出寫有任何字跡。但是用某一特定波長的光成像後,書中文字以最令人矚目的方式“彈跳出來”。我們沒有期待給阿基米德手稿成像會產生那麼清楚的結果,主要是因為,從物理和化學上來講,“羊皮書”是個複雜得多的對象。卷書上的文字沒有被擦掉過,也沒有被重疊書寫過,書的骨架沒有受過像“羊皮書”那樣的黴菌侵害。卷書只遭受過一次改變紙張化學成分和其中文字的災難性事變。我們再一次正確:沒有一個單一的波長能讓阿基米德手稿的文字彈跳出來。但這恰好是多光譜成像技術的用武之地。


數字

羅傑告訴我,多光譜成像是一門較新的技術,它只是在電腦和數碼成像技術出現之後才得到普及。電腦將它們接收的所有信息都變成數值--數碼(位)。實際上只有兩個“二進制數碼”(“位”或“比特”)被用到--0和1--但兩者以大量不同的方式組合。例如,你的手提電腦將你在鍵盤上敲入的鍵擊轉換成0和1的不同組合,電腦可以將它們儲存起來,或者用作為指令在你屏幕上產生某種圖案。當你在電腦上錄製數碼音樂,每一時間間隔的音響程度也是用數字表示。當你用數碼相機照相時,進入到相機鏡頭感光器的光被轉變成數值。每一“小塊”圖像,每個所謂的“圖片元素”或“像素”,都被賦予一個由若干1和0組成的數字。許多圖像是“八位”的,它們的像素所帶的數字是1和0的八位數組合。因此,舉例來說,數字10101010的值實際上是170(譯者註:普通十進制下)。數字11111111的值是255--這個是八位數可能的最大值,因為包括00000000在內只存在256種方式將0和1組合成八位數序列。為了提取這個數字信息,你需要一個軟件工具--這是給電腦中央處理器的一系列指令,它把數字分類,並以有用的方式將信息呈現出來。你最好是有合適的軟件工具:貝多芬第九交響樂不能湊成漂亮的圖像;“阿基米德羊皮書”製成的音樂很可能跟它的面貌一樣糟糕。

數碼技術有一個巨大的優勢,它能夠將來自圖像的數字進行不同方式的組合。你可以讓電腦調節圖像所含的數值--刪除太大或太小的數字;如果你認為某個小小的差異很重要,則將它放大。電腦就是用這個方式去除相機閃光燈帶來的紅眼效果的。然而,數碼技術還有一個優勢,你可以將一組數字同另一組疊在一起。例如,你可以在搖滾歌星的歌聲後面加入背景節拍。對於我們的目的,更重要的是,你可以把一種波長下拍攝的照片同另一種波長下拍攝的組合起來,使鏡頭下的某個特徵更加明顯。如果你在許多不同波長下拍攝,然後按照波長順序把所有不同圖像在電腦中一一疊放在一起,你得到的是一個關於數碼信息的“數據立方體”。請別把這個數據立方體想像成全息圖;把它想像成一組數目巨大的數字,它們包含着反映成像區域特徵的圖案(曲線)。通過編寫電腦算法(以特定方式調取數據的配方),科學家能夠將數據立方體切開,對數值進行處理,增強某些曲線,抽取他們想要的信息。從一個窄帶光源生成的數碼數據立方體中提取的信息,比從單一波長光照下的“羊皮書”中提取的信息,要多很多。

羅傑解釋道,從數據立方體提取信息的最基本步驟是“主要成分分析”。你讓電腦從各種波長下所攝圖像之數值的加權組合,製作出一系列圖片。這組新圖片的製作,根據的是相鄰像素的數值差別程度。因此,它們顯示的不是色彩的圖案,而是對比度(襯度)圖案。在這組新的圖片中,第一張從亮度上加強的是不同特徵之間對比度最大的區域;第二張顯示的是對比度第二大的區域;第三張的是第三大的區域;依此類推。在這個過程中,開始時的一組圖像是用不同波長拍攝的同一區域,結束時的一組圖像則將不同波長結合起來顯示同一圖像中的不同對象。顯然,在“羊皮書”中,第一主要成分顯示的是具有最大對比度的圖像特徵,那就是禱告文,淺棕色羊皮紙中間的黑亮墨跡。而第二主要成分的確以阿基米德表層下文字為主。再下一個(第三)主要成分圖像可能顯示的是霉變。一旦把各個成分的圖像分離出來,你就可以通過處理數字,按自己喜好讓它們儘可能亮或儘可能暗。

現代科學將光變成了數字,現代科學家能夠變換數字。但這裡的技巧在於如何變換數字,這不僅是一門科學,也是一門藝術。


數碼烹調

兩組成像人員於2000年6月開始了競賽,他們用的五頁文稿在古抄本運到華爾特博物館時就已從裝訂中脫落了。

比爾·克里斯頓巴里用的是一台柯達數碼相機。這是一種全世界的職業記者用的標準相機。它無法生成很大的數據立方體,但它的圖像空間分辨率較高。比爾和他的同事喬安娜·伯恩斯坦拍攝用的分辨率是每英寸600像素點(dpi)。比爾把自己處理數據的最佳效果稱作“切大餅”技術。他從紫外光譜範圍挑選一組圖像,其中禱告文和阿基米德文字看起來都相當清楚。接着,他將正常光下所攝圖像的主要成分分離出來,並挑選一張只顯示禱告文的圖像。然後他在電腦中處理這兩張圖片;他將禱告文圖像從同時顯示兩種文字的紫外線圖像中扣除,所以剩下的就只有阿基米德文字。

基茲和羅傑的高級相機,使得比爾看起來就像“石頭城樂園”里的弗萊德。他們的相機選擇不同的波長,不是通過放在鏡頭前的玻璃濾光片;而是使用最新的技術,叫做“液晶可調濾光器”(LCTF),通過擰動電子旋鈕來選擇入射光子的波長。它甚至還帶有一個微型電冰箱,使感光器保持冷卻。利用這個相機,基茲和羅傑能夠橫跨光譜以三十五種不同波長構造數據立方體--這個同比爾的數據立方體相比要大很多。這個相機的唯一缺點,就是它的拍攝分辨率只能達到每英寸200像素點。跟比爾的相機比較,它的光譜分辨率要高很多,而空間分辨率要低。

基茲和羅傑的數據處理方式也和比爾的很不一樣。他們檢查每張看過的對開頁,確定像素在三個不同類對象中的歸屬:明確是羊皮紙的像素,明確是禱告文的像素,還有另一類--很重要的--明確是阿基米德文字的像素。然後他們在所攝圖像中找到對應的像素--所有三十五張圖像--並且讓電腦評估每個像素的生死統計資料。於是,電腦計算出任意給定像素是禱告文像素、阿基米德像素或是羊皮紙像素的可能性。如果電腦肯定某個像素是阿基米德像素,它就變得很亮;如果不太肯定,它就暗一些。最後電腦把不同波長的結果綜合起來。這個技術叫做“匹配光譜過濾”。

看來比爾似乎是帶着刀來參加槍戰,或者至少是帶着傻瓜相機。然而,實際上我看了兩個小組的圖像,覺得它們都很棒:在我眼裡,比爾的圖像不比羅傑和基茲的遜色。在顯示阿基米德文字的圖像里,我能看到幾何插圖,原先在同一處什麼都看不見。我能看到阿基米德文字突然冒了出來。我看不到禱告文。它幾乎消失在羊皮紙背景中。我覺得我們已經破解了這個秘密。我保持着這個希望:有了這些圖像,我們能夠重新創建阿基米德手稿,如同它被擦掉重寫之前那樣。這將是中世紀手稿研究的侏羅紀公園,以及阿基米德的復活。如果你看到其中一張照片,你就會明白我的興奮和激動。我認為兩個小組的成像人員都完成了我們所要求的任務,我們唯一的問題是兩組裡面到底選哪個。

2000年10月20日星期五,“羊皮書”中的一段在美國廣播公司(ABC)已故主持人彼得·詹寧斯的新聞節目“今晚世界”里播出。它詳細敘述了成像科學家從巴爾地摩的古代手稿中找出抹掉的阿基米德文字的顯著成就。一夜之間,成像人員成了明星。三天之後星期一,他們有個討論會,向娜塔麗和熱維爾報告成果。我們大家都作好大吃一驚的準備。


差的配方

熱維爾無法參加討論會;他得了肺炎。娜塔麗·切內茨卡代表倆人提出批評意見。按照她的話,兩個小組的照片,尤其是基茲和羅傑那組的,都“失焦”了。照片上面有各種各樣無法解釋的白色斑點。它們的分辨率不夠高。去掉禱告文對解讀阿基米德文字沒有一點幫助。一般傳統的高分辨率照片和紫外燈下照的照片比這些電腦處理的照片要好得多。到底出了什麼錯?結果證明是,成像科學家和中世紀古文書學者之間相互溝通理解,不是一件容易的事。那麼讓我們作為成像人員,一條一條來考慮娜塔麗的意見。

她的第一條意見是,圖像失焦了。實際上它們沒有失焦。這裡的問題是所有多光譜成像人員所面臨的。要獲得不同波長的圖像,他們必須更換相機上的濾光鏡。因為穿過不同濾光鏡的光會以稍稍不同的角度折射,導致圖像大小有非常細微的差別。因為他們在許多不同的波長下成像,而這些圖像沒有適當地“對齊”,最後結果的確是,處理後的圖像看起來有些模糊。如果你是從太空對大片的地面攝像,然後要找到亞馬遜雨林中的一塊古柯種植地,這一點就沒有多大關係;而多光譜成像技術一般都是用於這種情況。但是,如果你是要解讀小小的十世紀希臘手稿中的精細微妙之物,這一點就確實有關係--非常有關係。很明顯,羅傑、基茲和比爾下一步得使用較少的波長,或者找到另一種方法避開這個“對齊”的問題。

她的第二條意見是,圖像中有很多白點,看起來好像它們應該是阿基米德文字,但其實不是。成像科學家將這種斑點稱為“人為假象”。成像人員發現,為B先生的書成像實際上是件非常棘手的事。因此,他們必須編寫十分複雜的軟件算法來提取阿基米德文字。每次你處理一幅圖像,你都是在處理數據。通過攪動、改變各種成分,你也許將你所需要的文字顯示了出來,但你同時也不可避免地加入了噪音。如前所述,這一點對於大部分多光譜成像的應用沒有關係,至少關係不大。但是如果要解讀阿基米德文字,這一點確實有關係,而且大有關係。科學家們必須找出更簡單的算法。

羅傑和基茲的成像分辨率是每英寸200像素點--大約每毫米8個像素。這個條件完全符合常理。如果是從正常距離看一頁書,這多多少少是眼睛中的視杆細胞和視錐細胞的分辨率,它也允許以現有的數碼相機將“羊皮書”一頁完整的對開頁分兩部分攝像。他們沒有攝製放大的對開頁圖像,那樣所需的分辨率要高得多。我們根本不知道熱維爾和娜塔麗想要研究放大的圖像,要了解文字中所有的重要特徵。如果可能,熱維爾要讓單獨一個阿基米德字符充滿整個電腦屏幕而仍然看不出像素點來;他喜歡那種好像通過顯微鏡觀察圖像的感覺。研究羊皮書文字時,尺寸畢竟很有關係。這是科學家應該吸取的另一個教訓,也是攝像機超過眼睛的另一個可能途徑。

但是,娜塔麗和熱維爾最令人意想不到、最有啟示性的意見,是成像人員把禱告文拿掉了。他們要求把禱告文再放回來。我們到底是在做什麼?為什麼?科學家實際上成功地將阿基米德文字和禱告書文字分離開,並剔除了禱告書文字,而現在古典學者卻說這些沒有用。沒有用的原因其實很簡單直接。科學家使禱告文的顏色跟羊皮紙的一模一樣從而使禱告文消失。現在的問題是,當阿基米德字符在一小塊禱告文之下消失時,古典學者不知道為什麼:他們再也不清楚,阿基米德字符看不見究竟是因為它們根本就不存在,還是因為它們實際上隱藏在禱告書字符下面。科學家製作的圖像的特點,不論我覺得有多出色,古典學者卻不給予重視。

星期一整天都是意見和批評。上午的時候我是非常肯定,認定他們傳來的是捷報;到了下午我還是非常肯定,只不過認定他們的結果毫無用處。我、阿比蓋爾以及本計劃的項目經理麥克·托茲在下班之前召開閉門會議。會議上讓我驚奇的是,麥克堅持認為什麼錯也沒出。他解釋道,實驗性成像計劃實際上就是這麼工作的。

如果你要科學家面對一個難題給出答案,你在定義那個問題時會出錯,科學家很可能會在第一次找不到最好的答案。麥克說,真正的難題是一步一步地解決的。這些步驟從批評開始,以理解結束。麥克說,在這種成像計劃中,科學家得出一個誤解的結果是很正常的。我們只不過正處在一個長久過程的開端,成像者終能完全了解古典學者的需求,並不斷完善自己的技術。麥克堅決認為,況且成像者做得很不錯:他們成功地將阿基米德文字同手稿其餘內容分開,有跡象表明他們提取出在正常照明條件下無法見到的阿基米德文字。他繼續道,我們不應該解僱成像人員,相反應該讓他們加盟,雇用他們所有人。換句話說,麥克認為B先生應該給所有三人發工資,讓他們為阿基米德計劃工作;我們應該將比爾的實驗性方法與基茲和羅傑的處理技巧相互結合。

事實上我覺得麥克並沒有胡說,因為我了解他對評價專業性計劃的結果有着豐富的經驗。但是我看不到前面的路,並且不敢想像“最終決策者”看完我給他發的電子郵件之後的反應。跟往常一樣,他的回答跟我冗長的公文書信相比要簡潔得多。他的決定是:“OK。”


牙牙學語

在這段持續到2001年3月的緊張日子裡,熱維爾和娜塔麗不斷嘗試根據科學家的圖像抄譯阿基米德原文。他們同時抄送我的電子郵件,透露出他們工作之艱難,仿佛別的都不算什麼。這裡是一封很有代表性的、熱維爾寫給娜塔麗的郵件:

娜塔麗,我有了進展!

請看48對開頁反面第一列第六行,在很容易認出的字perile/psomen後面。海伯格肯定錯了,他認為緊跟其後的是rho,中間沒有空隙--那裡肯定有一個單字符的空隙;另外他沒有加點的eta很糟糕。這個抄錄人喜歡將eta的短腳朝里彎一點,如同膝蓋抽筋時的反應,但這隻腳很平滑,像連續的拋物曲線;實際上,它更像抄錄人自己寫的kappa,而不是像eta。緊挨rho前面的那個字符較模糊,但很有點像alpha。海伯格說的結尾字符to/s看起來可能正確,因此我們可能的結果是ark[兩到三個字符]to/s。你覺得arkounto/s怎麼樣?這樣兩個挨在一起的詞就是perile/psomen arkounto/s--“我們要包括”,“充分地”。整個段落可以解讀成(比方說),kai allo/n pleiono/n (homoio/n touotois) theo/roumeno/n ta (pleista) ou perile/psomen, arkounto/s gar ho tropos hupodedeiktai dia to/n proeire/meno/n。我把完全是推測的詞放在括弧里,當然pleista有點lambda的樣子,還有我們都知道的第五行開頭的那個“moi”。

這段抄譯是熱維爾根據一張試驗圖像作出的。它也許對娜塔麗有過幫助,但對成像人員卻毫無用處。在概念驗證中,熱維爾找到他自己的方法,顯示哪些文字他可以譯解,哪些還需要繼續努力。他用畫圖做到這點。

熱維爾用的主要是紫外線圖像,他用綠色表示自己可以譯解的,用紅色表示只能猜測的。在這些照片中的紅色多得令人擔憂。有時候他在發送的圖像中寫上自己的問題。一段特別重要的段落好像在第105對開頁上。熱維爾寫的都是看到的,但坦承自己完全是在猜測這一頁。這看起來像是異常費力的事。它的確是。當然這個努力是值得的:最終我們發現阿基米德了解實際無窮的概念。然而,我們不能這樣無休止地下去。

0%(0)
0%(0)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制
一周點擊熱帖 更多>>
一周回復熱帖
歷史上的今天:回復熱帖
2006: 你的禁忌,與我無關
2006: 昨晚的電視靜悄悄
2005: 無香:開悟
2005: 天不知地知(男生免進)
2004: 網下弱人
2004: 有話的烏托幫情人
2003: 議員與民眾——我的親身經歷
2003: 流音
2002: 不老的山口百惠:橫須賀,永遠的橫須賀
2002: 如果每一個中國人都實現了自我