设万维读者为首页 广告服务 联系我们 关于万维
简体 繁体 手机版
分类广告
版主:阿飞的剑
万维读者网 > 茗香茶语 > 帖子
第九章 数码羊皮书
送交者: 林教头 2007年06月28日16:46:22 于 [茗香茶语] 发送悄悄话

阿比盖尔终于拆开了“羊皮书”,热维尔和斋藤健对此的回报,是冲破希腊数学思想界限的见识。不过有一点从一开始就很清楚:阿比盖尔的工作只是让B先生的书走向彻底变化的一步。当她拆开祷告书时,我要求科学家将祷告书中的所有羊皮纸抄本再放回到一起,就像在1229年之前那样。

我不是让科学家复制“羊皮书”;我只是要他们替换它。我希望他们制作的替换品比古抄本要好得多,这样古典学者就不必专程到巴尔地摩朝圣。我要求他们将看不见的东西变成看得见的,让全世界的人从电脑上能看到它,让它看起来整齐有序。阿基米德的文稿当然放在第一,然后是其它古抄本的文稿。这听起来像乌托邦的幻想。说到底,我们连其它抄本有多少都不知道,就更别提它们的内容啦!但是,我们在2005年获得的结果超出了所有人的期望:古典学者现在能够读到的文稿,在1998年那时连做梦都想不到;他们过去无法从手稿中读到这些内容,现在他们得从电脑上读。然而这项成功来之不易,花费了很长时间。

从一开始大家就清楚,两个科学家小组--比尔·克里斯顿巴里率领的约翰·霍普金斯大学的小组,以及罗切斯特理工学院的罗杰·伊斯顿和基兹·诺克思--主要依赖和使用的工具是所谓的“多光谱成像”技术。我需要理解“多光谱成像”的含义,我的辅导员是他们中间唯一的教授罗杰·伊斯顿,他是罗切斯特理工学院成像科学系的教授。我认为图像是艺术家创作的不同形状。罗杰认为图像是光产生的数字。毫不奇怪,他向我解释他的观点花了一些时间。


罗杰告诉我说,不论是来自太阳还是灯泡的光,都是以电磁波的形式,这些电磁波由叫做光子的微小能量包组成。光子可以用它们波峰之间的距离来表征,也就是它们的波长。某些光子的波长很长,比如无线电波、微波和红外光波,另一些光子的波长短得多,比如紫外光波、X射线和伽玛射线。可见光只是整个电磁光谱的一小部分,从红外到紫外。光子的波长越短,它的能量越高;然而所有的光子在真空中运动的速度都是完全一样--这就是著名的光速:每秒钟十八万六千二百八十二英里(译者注:约每秒三十万公里)。

光子和物质相互作用,后者由原子组成。更具体地说,光子和分布在原子核周围的电子相互作用。并非所有的光子能同所有的电子相互作用:关键是这种相互作用取决于它们各自的能量;它们必须相互发生共振。如果是这样,光子则会改变电子的能量状态,作为回应电子则会自己发射一个光子。任一指定电子发射的光子会有精确的波长,或者精确的能量,这个波长取决于电子需要放出的能量,而这又取决于电子在原子结构中的位置。

人类的眼睛利用光子来得到彩虹中所有的颜色。这是眼睛工作的原理。借助眼球的水晶体,眼睛将物体中电子发射的光子聚焦在视网膜的感光细胞上。光子引起这些感光细胞的化学变化。细胞的变化取决于所接收光子的波长:当你的眼细胞接收到波长大约为400纳米的光子,它们的变化产生一股电流,通过视神经传到大脑的视觉中心,后者将电流表示为颜色:蓝色。当你的眼细胞接收到波长大约为700纳米的光子,同样的过程又出现,但化学变化有点不同,产生的电流也不同,最后的颜色不一样。这时,你会看到红色。我们阅读的过程,是将大脑视觉中心产生的强度和色彩的图案辨认识别为字母。问题是,“羊皮书”表层下文字中的很多字母,即使在明亮的阳光下也无法辨认。

“胜过太阳的光源会是什么样?”我问罗杰,“胜过眼睛的感光器官会是什么样?”太阳作为光源的麻烦是,它发射的是各种各样波长的光子。阳光下眼睛看到的图像,是所有可见波长产生的图像的总和。如果能够找到一种光源,发射的光波波长只占光谱中很窄一个频带或波段(译者注:波长几乎不变),那么产生的图像只携带来自那一个波长的信息,而不被其它波长的光覆盖。

例如,考虑一下紫外灯形成的图像。虽然这种灯产生的光子波长比眼睛能察觉的要短,它们照在羊皮纸上的效果是显著可见的。它们将能量传给羊皮纸中的原子和分子,后者吸收部分能量,并将剩下能量以光子形式重新发射,被发射光子的波长恰好在可见光光谱的蓝色波段。当羊皮纸重新发射可见光子时,羊皮纸上的墨迹遮挡这些光子使它们变暗。最后效果是,从这片“荧光”发出的柔和蓝光“从背后照亮”了墨迹。表层下模糊文字的对比清晰度增加了,因此文字变得更好辨认。很久以来,古典学者一直用紫外荧光灯阅读羊皮纸手稿,效果非常好。热维尔和斋藤健用它来读过《方法论》一文中第十四命题。但是,除了在暗室之外,紫外灯无法有效使用;其它频率(波长)的光子完全遮盖了它的效果。

人眼本身是一件如此令人惊叹的复杂器官,很难想像一个人造眼可以胜过它。但是眼睛也有很多我们平常不会注意的局限,因为它已经演化并适应我们的日常需求。只不过,当我们想做的事跟平常不同,眼睛的局限才会更加明显。罗杰解释道,观察行星不是容易的事,因为视网膜上的图像尺寸很小,只覆盖少数几个眼睛的感应器(感光细胞)。因为每个感应器“看见”的都是行星的一大部分,眼睛无法看见(“分辨”)很小的细节。这时,望远镜就能发挥用途。或者,考虑另外一个问题:我发现天黑后很难看见我的小猫格雷西,因为人的视网膜细胞不会对温血动物身体发出的波长有反应;这些红外波长比我们可见光光线的波长大很多。人类眼睛只对电磁光谱的很小一部分有反应。但是现代摄像机能够探测到红外线波长,发现黑暗中的温血动物。这就是我们为什么用摄像机,而不是眼睛,来读“羊皮书”的根本原因。现代摄像机跟人眼不一样,它们对可见光光谱之外的光也敏感,所以它们能够“看见”令人眼变“盲”的信息。

简而言之,当你使用窄带频宽照明并用相机进行捕获,你得到的结果跟你在阳光下观看对象的结果可能完全不一样。摄影者在不同窄带照明条件下使用相机揭示隐藏的秘密文字,在世界各地都取得了显著的成功。例如,杨百翰大学一个小组研究了公元79年8月24日星期二午后不久爆发的维苏威火山的遗迹,对埋在赫库兰尼姆古城火山灰下炭化的图书馆卷书进行成像,取得了非凡的结果。在普通光之下,很多卷书上根本看不出写有任何字迹。但是用某一特定波长的光成像后,书中文字以最令人瞩目的方式“弹跳出来”。我们没有期待给阿基米德手稿成像会产生那么清楚的结果,主要是因为,从物理和化学上来讲,“羊皮书”是个复杂得多的对象。卷书上的文字没有被擦掉过,也没有被重叠书写过,书的骨架没有受过像“羊皮书”那样的霉菌侵害。卷书只遭受过一次改变纸张化学成分和其中文字的灾难性事变。我们再一次正确:没有一个单一的波长能让阿基米德手稿的文字弹跳出来。但这恰好是多光谱成像技术的用武之地。


数字

罗杰告诉我,多光谱成像是一门较新的技术,它只是在电脑和数码成像技术出现之后才得到普及。电脑将它们接收的所有信息都变成数值--数码(位)。实际上只有两个“二进制数码”(“位”或“比特”)被用到--0和1--但两者以大量不同的方式组合。例如,你的手提电脑将你在键盘上敲入的键击转换成0和1的不同组合,电脑可以将它们储存起来,或者用作为指令在你屏幕上产生某种图案。当你在电脑上录制数码音乐,每一时间间隔的音响程度也是用数字表示。当你用数码相机照相时,进入到相机镜头感光器的光被转变成数值。每一“小块”图像,每个所谓的“图片元素”或“像素”,都被赋予一个由若干1和0组成的数字。许多图像是“八位”的,它们的像素所带的数字是1和0的八位数组合。因此,举例来说,数字10101010的值实际上是170(译者注:普通十进制下)。数字11111111的值是255--这个是八位数可能的最大值,因为包括00000000在内只存在256种方式将0和1组合成八位数序列。为了提取这个数字信息,你需要一个软件工具--这是给电脑中央处理器的一系列指令,它把数字分类,并以有用的方式将信息呈现出来。你最好是有合适的软件工具:贝多芬第九交响乐不能凑成漂亮的图像;“阿基米德羊皮书”制成的音乐很可能跟它的面貌一样糟糕。

数码技术有一个巨大的优势,它能够将来自图像的数字进行不同方式的组合。你可以让电脑调节图像所含的数值--删除太大或太小的数字;如果你认为某个小小的差异很重要,则将它放大。电脑就是用这个方式去除相机闪光灯带来的红眼效果的。然而,数码技术还有一个优势,你可以将一组数字同另一组叠在一起。例如,你可以在摇滚歌星的歌声后面加入背景节拍。对于我们的目的,更重要的是,你可以把一种波长下拍摄的照片同另一种波长下拍摄的组合起来,使镜头下的某个特征更加明显。如果你在许多不同波长下拍摄,然后按照波长顺序把所有不同图像在电脑中一一叠放在一起,你得到的是一个关于数码信息的“数据立方体”。请别把这个数据立方体想像成全息图;把它想像成一组数目巨大的数字,它们包含着反映成像区域特征的图案(曲线)。通过编写电脑算法(以特定方式调取数据的配方),科学家能够将数据立方体切开,对数值进行处理,增强某些曲线,抽取他们想要的信息。从一个窄带光源生成的数码数据立方体中提取的信息,比从单一波长光照下的“羊皮书”中提取的信息,要多很多。

罗杰解释道,从数据立方体提取信息的最基本步骤是“主要成分分析”。你让电脑从各种波长下所摄图像之数值的加权组合,制作出一系列图片。这组新图片的制作,根据的是相邻像素的数值差别程度。因此,它们显示的不是色彩的图案,而是对比度(衬度)图案。在这组新的图片中,第一张从亮度上加强的是不同特征之间对比度最大的区域;第二张显示的是对比度第二大的区域;第三张的是第三大的区域;依此类推。在这个过程中,开始时的一组图像是用不同波长拍摄的同一区域,结束时的一组图像则将不同波长结合起来显示同一图像中的不同对象。显然,在“羊皮书”中,第一主要成分显示的是具有最大对比度的图像特征,那就是祷告文,浅棕色羊皮纸中间的黑亮墨迹。而第二主要成分的确以阿基米德表层下文字为主。再下一个(第三)主要成分图像可能显示的是霉变。一旦把各个成分的图像分离出来,你就可以通过处理数字,按自己喜好让它们尽可能亮或尽可能暗。

现代科学将光变成了数字,现代科学家能够变换数字。但这里的技巧在于如何变换数字,这不仅是一门科学,也是一门艺术。


数码烹调

两组成像人员于2000年6月开始了竞赛,他们用的五页文稿在古抄本运到华尔特博物馆时就已从装订中脱落了。

比尔·克里斯顿巴里用的是一台柯达数码相机。这是一种全世界的职业记者用的标准相机。它无法生成很大的数据立方体,但它的图像空间分辨率较高。比尔和他的同事乔安娜·伯恩斯坦拍摄用的分辨率是每英寸600像素点(dpi)。比尔把自己处理数据的最佳效果称作“切大饼”技术。他从紫外光谱范围挑选一组图像,其中祷告文和阿基米德文字看起来都相当清楚。接着,他将正常光下所摄图像的主要成分分离出来,并挑选一张只显示祷告文的图像。然后他在电脑中处理这两张图片;他将祷告文图像从同时显示两种文字的紫外线图像中扣除,所以剩下的就只有阿基米德文字。

基兹和罗杰的高级相机,使得比尔看起来就像“石头城乐园”里的弗莱德。他们的相机选择不同的波长,不是通过放在镜头前的玻璃滤光片;而是使用最新的技术,叫做“液晶可调滤光器”(LCTF),通过拧动电子旋钮来选择入射光子的波长。它甚至还带有一个微型电冰箱,使感光器保持冷却。利用这个相机,基兹和罗杰能够横跨光谱以三十五种不同波长构造数据立方体--这个同比尔的数据立方体相比要大很多。这个相机的唯一缺点,就是它的拍摄分辨率只能达到每英寸200像素点。跟比尔的相机比较,它的光谱分辨率要高很多,而空间分辨率要低。

基兹和罗杰的数据处理方式也和比尔的很不一样。他们检查每张看过的对开页,确定像素在三个不同类对象中的归属:明确是羊皮纸的像素,明确是祷告文的像素,还有另一类--很重要的--明确是阿基米德文字的像素。然后他们在所摄图像中找到对应的像素--所有三十五张图像--并且让电脑评估每个像素的生死统计资料。于是,电脑计算出任意给定像素是祷告文像素、阿基米德像素或是羊皮纸像素的可能性。如果电脑肯定某个像素是阿基米德像素,它就变得很亮;如果不太肯定,它就暗一些。最后电脑把不同波长的结果综合起来。这个技术叫做“匹配光谱过滤”。

看来比尔似乎是带着刀来参加枪战,或者至少是带着傻瓜相机。然而,实际上我看了两个小组的图像,觉得它们都很棒:在我眼里,比尔的图像不比罗杰和基兹的逊色。在显示阿基米德文字的图像里,我能看到几何插图,原先在同一处什么都看不见。我能看到阿基米德文字突然冒了出来。我看不到祷告文。它几乎消失在羊皮纸背景中。我觉得我们已经破解了这个秘密。我保持着这个希望:有了这些图像,我们能够重新创建阿基米德手稿,如同它被擦掉重写之前那样。这将是中世纪手稿研究的侏罗纪公园,以及阿基米德的复活。如果你看到其中一张照片,你就会明白我的兴奋和激动。我认为两个小组的成像人员都完成了我们所要求的任务,我们唯一的问题是两组里面到底选哪个。

2000年10月20日星期五,“羊皮书”中的一段在美国广播公司(ABC)已故主持人彼得·詹宁斯的新闻节目“今晚世界”里播出。它详细叙述了成像科学家从巴尔地摩的古代手稿中找出抹掉的阿基米德文字的显著成就。一夜之间,成像人员成了明星。三天之后星期一,他们有个讨论会,向娜塔丽和热维尔报告成果。我们大家都作好大吃一惊的准备。


差的配方

热维尔无法参加讨论会;他得了肺炎。娜塔丽·切内茨卡代表俩人提出批评意见。按照她的话,两个小组的照片,尤其是基兹和罗杰那组的,都“失焦”了。照片上面有各种各样无法解释的白色斑点。它们的分辨率不够高。去掉祷告文对解读阿基米德文字没有一点帮助。一般传统的高分辨率照片和紫外灯下照的照片比这些电脑处理的照片要好得多。到底出了什么错?结果证明是,成像科学家和中世纪古文书学者之间相互沟通理解,不是一件容易的事。那么让我们作为成像人员,一条一条来考虑娜塔丽的意见。

她的第一条意见是,图像失焦了。实际上它们没有失焦。这里的问题是所有多光谱成像人员所面临的。要获得不同波长的图像,他们必须更换相机上的滤光镜。因为穿过不同滤光镜的光会以稍稍不同的角度折射,导致图像大小有非常细微的差别。因为他们在许多不同的波长下成像,而这些图像没有适当地“对齐”,最后结果的确是,处理后的图像看起来有些模糊。如果你是从太空对大片的地面摄像,然后要找到亚马逊雨林中的一块古柯种植地,这一点就没有多大关系;而多光谱成像技术一般都是用于这种情况。但是,如果你是要解读小小的十世纪希腊手稿中的精细微妙之物,这一点就确实有关系--非常有关系。很明显,罗杰、基兹和比尔下一步得使用较少的波长,或者找到另一种方法避开这个“对齐”的问题。

她的第二条意见是,图像中有很多白点,看起来好像它们应该是阿基米德文字,但其实不是。成像科学家将这种斑点称为“人为假象”。成像人员发现,为B先生的书成像实际上是件非常棘手的事。因此,他们必须编写十分复杂的软件算法来提取阿基米德文字。每次你处理一幅图像,你都是在处理数据。通过搅动、改变各种成分,你也许将你所需要的文字显示了出来,但你同时也不可避免地加入了噪音。如前所述,这一点对于大部分多光谱成像的应用没有关系,至少关系不大。但是如果要解读阿基米德文字,这一点确实有关系,而且大有关系。科学家们必须找出更简单的算法。

罗杰和基兹的成像分辨率是每英寸200像素点--大约每毫米8个像素。这个条件完全符合常理。如果是从正常距离看一页书,这多多少少是眼睛中的视杆细胞和视锥细胞的分辨率,它也允许以现有的数码相机将“羊皮书”一页完整的对开页分两部分摄像。他们没有摄制放大的对开页图像,那样所需的分辨率要高得多。我们根本不知道热维尔和娜塔丽想要研究放大的图像,要了解文字中所有的重要特征。如果可能,热维尔要让单独一个阿基米德字符充满整个电脑屏幕而仍然看不出像素点来;他喜欢那种好像通过显微镜观察图像的感觉。研究羊皮书文字时,尺寸毕竟很有关系。这是科学家应该吸取的另一个教训,也是摄像机超过眼睛的另一个可能途径。

但是,娜塔丽和热维尔最令人意想不到、最有启示性的意见,是成像人员把祷告文拿掉了。他们要求把祷告文再放回来。我们到底是在做什么?为什么?科学家实际上成功地将阿基米德文字和祷告书文字分离开,并剔除了祷告书文字,而现在古典学者却说这些没有用。没有用的原因其实很简单直接。科学家使祷告文的颜色跟羊皮纸的一模一样从而使祷告文消失。现在的问题是,当阿基米德字符在一小块祷告文之下消失时,古典学者不知道为什么:他们再也不清楚,阿基米德字符看不见究竟是因为它们根本就不存在,还是因为它们实际上隐藏在祷告书字符下面。科学家制作的图像的特点,不论我觉得有多出色,古典学者却不给予重视。

星期一整天都是意见和批评。上午的时候我是非常肯定,认定他们传来的是捷报;到了下午我还是非常肯定,只不过认定他们的结果毫无用处。我、阿比盖尔以及本计划的项目经理麦克·托兹在下班之前召开闭门会议。会议上让我惊奇的是,麦克坚持认为什么错也没出。他解释道,实验性成像计划实际上就是这么工作的。

如果你要科学家面对一个难题给出答案,你在定义那个问题时会出错,科学家很可能会在第一次找不到最好的答案。麦克说,真正的难题是一步一步地解决的。这些步骤从批评开始,以理解结束。麦克说,在这种成像计划中,科学家得出一个误解的结果是很正常的。我们只不过正处在一个长久过程的开端,成像者终能完全了解古典学者的需求,并不断完善自己的技术。麦克坚决认为,况且成像者做得很不错:他们成功地将阿基米德文字同手稿其余内容分开,有迹象表明他们提取出在正常照明条件下无法见到的阿基米德文字。他继续道,我们不应该解雇成像人员,相反应该让他们加盟,雇用他们所有人。换句话说,麦克认为B先生应该给所有三人发工资,让他们为阿基米德计划工作;我们应该将比尔的实验性方法与基兹和罗杰的处理技巧相互结合。

事实上我觉得麦克并没有胡说,因为我了解他对评价专业性计划的结果有着丰富的经验。但是我看不到前面的路,并且不敢想像“最终决策者”看完我给他发的电子邮件之后的反应。跟往常一样,他的回答跟我冗长的公文书信相比要简洁得多。他的决定是:“OK。”


牙牙学语

在这段持续到2001年3月的紧张日子里,热维尔和娜塔丽不断尝试根据科学家的图像抄译阿基米德原文。他们同时抄送我的电子邮件,透露出他们工作之艰难,仿佛别的都不算什么。这里是一封很有代表性的、热维尔写给娜塔丽的邮件:

娜塔丽,我有了进展!

请看48对开页反面第一列第六行,在很容易认出的字perile/psomen后面。海伯格肯定错了,他认为紧跟其后的是rho,中间没有空隙--那里肯定有一个单字符的空隙;另外他没有加点的eta很糟糕。这个抄录人喜欢将eta的短脚朝里弯一点,如同膝盖抽筋时的反应,但这只脚很平滑,像连续的抛物曲线;实际上,它更像抄录人自己写的kappa,而不是像eta。紧挨rho前面的那个字符较模糊,但很有点像alpha。海伯格说的结尾字符to/s看起来可能正确,因此我们可能的结果是ark[两到三个字符]to/s。你觉得arkounto/s怎么样?这样两个挨在一起的词就是perile/psomen arkounto/s--“我们要包括”,“充分地”。整个段落可以解读成(比方说),kai allo/n pleiono/n (homoio/n touotois) theo/roumeno/n ta (pleista) ou perile/psomen, arkounto/s gar ho tropos hupodedeiktai dia to/n proeire/meno/n。我把完全是推测的词放在括弧里,当然pleista有点lambda的样子,还有我们都知道的第五行开头的那个“moi”。

这段抄译是热维尔根据一张试验图像作出的。它也许对娜塔丽有过帮助,但对成像人员却毫无用处。在概念验证中,热维尔找到他自己的方法,显示哪些文字他可以译解,哪些还需要继续努力。他用画图做到这点。

热维尔用的主要是紫外线图像,他用绿色表示自己可以译解的,用红色表示只能猜测的。在这些照片中的红色多得令人担忧。有时候他在发送的图像中写上自己的问题。一段特别重要的段落好像在第105对开页上。热维尔写的都是看到的,但坦承自己完全是在猜测这一页。这看起来像是异常费力的事。它的确是。当然这个努力是值得的:最终我们发现阿基米德了解实际无穷的概念。然而,我们不能这样无休止地下去。

0%(0)
0%(0)
标 题 (必选项):
内 容 (选填项):
实用资讯
回国机票$360起 | 商务舱省$200 | 全球最佳航空公司出炉:海航获五星
海外华人福利!在线看陈建斌《三叉戟》热血归回 豪情筑梦 高清免费看 无地区限制
一周点击热帖 更多>>
一周回复热帖
历史上的今天:回复热帖
2006: 你的禁忌,与我无关
2006: 昨晚的电视静悄悄
2005: 无香:开悟
2005: 天不知地知(男生免进)
2004: 网下弱人
2004: 有话的乌托帮情人
2003: 议员与民众——我的亲身经历
2003: 流音
2002: 不老的山口百惠:横须贺,永远的横须贺
2002: 如果每一个中国人都实现了自我