系統生物學面面觀
系統理論和系統思想對於我國知識分子並不陌生。1980年代在我國學術界曾經流行過“
三論”——系統論、信息論和控制論,其中的“系統論”是指奧地利科學家貝塔朗菲(L.
Bertalanffy)在1970年代創立的“一般系統論”(general system theory)。儘管貝塔
朗菲是以生物學家的身份去思考、研究並提出系統論的,但他的系統論並不僅僅適用於生
命科學,而且適用於物理學、心理學、經濟學和社會科學等各門學科。如果說過去所談論
的是指在哲學層面上的、普適性強的一般系統論,那麼本文所要介紹的系統生物學(sys-
tems biology),則是生命科學研究領域的一門新興學科。
作為人類基因組計劃的發起人之一,美國科學家萊諾伊·胡德(Leroy Hood)也是系
統生物學的創始人之一。在胡德看來,系統生物學和人類基因組計劃有着密切的關係。正
是在基因組學、蛋白質組學等新型大科學發展的基礎上,孕育了系統生物學。反之,系統
生物學的誕生進一步提升了後基因組時代的生命科學研究能力。正如胡德所說,“系統生
物學將是21世紀醫學和生物學的核心驅動力”[1]。基於這一信念,胡德在1999年年底辭
去了美國西雅圖市華盛頓大學的教職,與另外兩名志同道合的科學家一起創立了世界上第
一個系統生物學研究所(Institute for Systems Biology)。隨後,系統生物學便逐漸得
到了生物學家的認同,也喚起了一大批生物學研究領域以外的專家的關注。2002年3月,
美國《科學》周刊登載了系統生物學專集。該專集導論中的第一句話這樣寫道:“如果對
當前流行的、時髦的關鍵詞進行一番分析,那麼人們會發現,'系統'高居在排行榜上。”
什麼是系統生物學?根據胡德的定義,系統生物學是研究一個生物系統中所有組成成
分(基因、mRNA、蛋白質等)的構成,以及在特定條件下這些組分間的相互關係的學科[1]
。也就是說,系統生物學不同於以往的實驗生物學——僅關心個別的基因和蛋白質,它要
研究所有的基因、所有的蛋白質、組分間的所有相互關係。顯然,系統生物學是以整體性
研究為特徵的一種大科學。
系統生物學的基本工作流程有這樣四個階段。首先是對選定的某一生物系統的所有組
分進行了解和確定,描繪出該系統的結構,包括基因相互作用網絡和代謝途徑,以及細胞
內和細胞間的作用機理,以此構造出一個初步的系統模型。第二步是系統地改變被研究對
象的內部組成成分(如基因突變)或外部生長條件,然後觀測在這些情況下系統組分或結
構所發生的相應變化,包括基因表達、蛋白質表達和相互作用、代謝途徑等的變化,並把
得到的有關信息進行整合。第三步是把通過實驗得到的數據與根據模型預測的情況進行比
較,並對初始模型進行修訂。第四階段是根據修正後的模型的預測或假設,設定和實施新
的改變系統狀態的實驗,重複第二步和第三步,不斷地通過實驗數據對模型進行修訂和精
練。系統生物學的目標就是要得到一個理想的模型,使其理論預測能夠反映出生物系統的
真實性。
系統生物學的靈魂——整合
作為後基因組時代的新秀,系統生物學與基因組學、蛋白質組學等各種“組學”的不
同之處在於,它是一種整合型大科學。首先,它要把系統內不同性質的構成要素(基因、
mRNA、蛋白質、生物小分子等)整合在一起進行研究。系統生物學研究所的第一篇研究論
文,就是整合酵母的基因組分析和蛋白質組分析,研究酵母的代謝網絡[2]。由於不同生物
分子的研究難度不一樣,技術發展程度不一樣,目前對它們的研究水平有較大的差距。例
如,基因組和基因表達方面的研究已經比較完善,而蛋白質研究就較為困難,至於涉及生
物小分子的代謝組分的研究就更不成熟。因此,要真正實現這種整合還有很長的路要走。
對於多細胞生物而言,系統生物學要實現從基因到細胞、到組織、到個體的各個層次
的整合。《科學》周刊系統生物學專集中一篇題為“心臟的模型化——從基因到細胞、到
整個器官”的論文,很好地體現了這種整合性[3]。我們知道,系統科學的核心思想是:
“整體大於部分之和”;系統特性是不同組成部分、不同層次間相互作用而“湧現”的新
性質;對組成部分或低層次的分析並不能真正地預測高層次的行為。如何通過研究和整合
去發現和理解湧現的系統性質,是系統生物學面臨的一個帶根本性的挑戰。
系統生物學整合性的第三層含義是指研究思路和方法的整合。經典的分子生物學研究
是一種垂直型的研究,即採用多種手段研究個別的基因和蛋白質。首先是在DNA水平上尋
找特定的基因,然後通過基因突變、基因剔除等手段研究基因的功能;在基因研究的基礎
上,研究蛋白質的空間結構,蛋白質的修飾以及蛋白質間的相互作用等等。基因組學、蛋
白質組學和其他各種“組學”則是水平型研究,即以單一的手段同時研究成千上萬個基因
或蛋白質。而系統生物學的特點,則是要把水平型研究和垂直型研究整合起來,成為一種
“三維”的研究。此外,系統生物學還是典型的多學科交叉研究,它需要生命科學、信息
科學、數學、計算機科學等各種學科的共同參與。
系統生物學的整合性可以體現在兩種不同的策略上。第一種就是胡德和系統生物學研
究所採用的方式,選定一個較為簡單的系統,如單細胞生物酵母,然後分析儘可能多的構
成成分——基因組、轉錄組、蛋白質組、相互作用組,以揭示整個系統的行為。另外一種
策略是吉爾曼(A. G. Gilman)領導的“信號轉導聯軍”採用的,以一個較為複雜的系統
(G蛋白介導的和與其相關的細胞信號轉導系統)為研究對象,採用儘可能多的研究手段
去進行分析(詳細介紹見本刊2002年第2期第36頁)。
系統生物學的基礎——信息
在前分子生物學時代,生物學家把生命視為具有特殊“活力”的有機體,遵循着無機
界不存在的法則進行生命活動。在分子生物學時代,研究者們把生命視為一架精密的機器
,由基因和蛋白質根據物理、化學的規律來運轉。在後基因組時代,像胡德這種類型的科
學家,把生命視為信息的載體,一切特性都可以從信息的流動中得到實現。
胡德提出,應該把生物學視為一門信息科學[1]。這個觀點包含有三層意思。首先,生
物學研究的核心——基因組,是數字化的(digital)。生物學與所有其他學科,如物理學
、化學、地理學,是完全不一樣的科學,因為生物學以外的學科都只能通過類比的方式
(analog)進行分析。既然生物學研究的核心是數字化的,因此生物學可以被完全破譯。
從理論上說,我們對生物學的把握應該超過其他任何一門學科。其次,生命的數字化核心
表現為兩大類型的信息,第一類信息是指編碼蛋白質的基因,第二類信息是指控制基因行
為的調控網絡。顯然,由一段DNA序列組成的基因是數字化的。值得強調的是,基因調控網
絡的信息從本質上說也是數字化的,因為控制基因表達的轉錄因子結合位點也是核苷酸序
列。生物學是信息科學的第三層意思是,生物信息是有等級次序的,而且沿着不同的層次
流動。一般說來,生物信息以這樣的方向進行流動:DNA→mRNA→蛋白質→蛋白質相互作用
網絡→細胞→器官→個體→群體。這裡要注意的是,每個層次信息都對理解生命系統的運
行提供有用的視角。因此,系統生物學的重要任務就是要儘可能地獲得每個層次的信息並
將它們進行整合[1]。
根據系統論的觀點,構成系統的關鍵不是其組成的物質,而是組成部分的相互作用或
部分之間的關係。這些相互作用或者關係,從本質上說就是信息。換一個角度來說,生命
是遠離平衡態的開放系統,為了維持其有序性,生命系統必須不斷地與外部環境交換能量
,以抵消其熵增過程。奧地利物理學家薛定諤早在1940年代發表的著作《生命是什麼?》
中就已指出,生命以“負熵流”為食,而“負熵”其實就是信息的另一種表示方法。因此
,我們可以這樣說,生命系統是一個信息流的過程,系統生物學就是要研究並揭示這種信
息的運行規律。
系統生物學的鑰匙——干涉
系統生物學一方面要了解生物系統的結構組成,另一方面是要揭示系統的行為方式。
相比之下,後一個任務更為重要。也就是說,系統生物學研究的並非一種靜態的結構,而
是要在人為控制的狀態下,揭示出特定的生命系統在不同的條件下和不同的時間裡具有什
麼樣的動力學特徵。
凡是實驗科學都有這樣一種特徵:人為地設定某種或某些條件去作用於被實驗的對象
,從而達到實驗的目的。這種對實驗對象的人為影響就是干涉(perturbation)。傳統生
物學採用非干涉方法如形態觀察或分類研究生物體。20世紀形成的分子生物學等實驗生物
學的特點就是,科學家可以在實驗室內利用各種手段干涉生物學材料,如通過誘導基因突
變或修飾蛋白質,由此研究其性質和功能。系統生物學同樣也是一門實驗性科學,也離不
開干涉這一重要的工具。
系統生物學中的干涉有這樣一些特點。首先,這些干涉應該是有系統性的。例如人為
誘導基因突變,過去大多是隨機的;而在進行系統生物學研究時,應該採用的是定向的突
變技術。上面所提到的對酵母的系統生物學研究,胡德等人就是把已知的參與果糖代謝的
9個基因逐一進行突變,研究在每一個基因突變下的系統變化[2]。果蠅從受精開始到形成
成熟個體一共有66個典型的發育階段,不久前科學家利用基因芯片技術,對每一個發育階
段的基因表達譜進行了系統的研究[4]。這也是一類系統性的干涉方式。其次,系統生物學
需要高通量的干涉能力,如高通量的遺傳變異。現有技術已經能做到在短時間內,把酵母
的全部6000多個基因逐一進行突變。對於較為複雜的多細胞生物,可以通過RNA干涉新技術
來實現大規模的基因定向突變。隨着研究技術的發展,一定還會有許多新的干涉技術應用
於系統生物學。
需要提請人們注意的是,以測定基因組全序列或全部蛋白質組成的基因組研究或蛋白
質組研究等“規模型大科學”,並不屬於經典的實驗科學。這類工作中並不需要干涉,其
目標只是把系統的全部元素測定清楚,以便得到一個含有所有信息的數據庫。胡德把這種
類型的研究稱為“發現的科學”(discovery science),而把上述依賴於干涉的實驗科學
稱為“假設驅動的科學”(hypothesis-driven science),因為選擇干涉就是在做出假設
。系統生物學不同於一般的實驗生物學就在於,它既需要“發現的科學”,也需要“假設
驅動的科學”。首先要選擇一種條件(干涉),然後利用“發現的科學”的方法,對系統
在該條件下的所有元素進行測定和分析;在此基礎上做出新的假設,然後再利用“發現的
科學”研究手段進行新研究。這兩種不同研究策略和方法的互動和整合,是系統生物學成
功的保證。
筆者還要再強調一點,在注重這兩類研究手段的同時,不應該忽略系統生物學的另一
個特點——對理論的依賴和建立模型的需求。在本文一開始介紹系統生物學的概況時,特
別指出過,系統生物學的理想就是要得到一個儘可能接近真正生物系統的理論模型;建模
過程貫穿在系統生物學研究的每一個階段。離開了數學和計算機科學,就不會有系統生物
學。也許正是基於這一考慮,科學家把系統生物學分為“濕”的實驗部分(實驗室內的研
究)和“干”的實驗部分(計算機模擬和理論分析)[5]。“濕”、“干”實驗的完美整
合才是真正的系統生物學。
從某種意義上說,系統生物學在中國有很好的基礎。我們的傳統醫學就是把人體視為
一個系統,通過測定和改變系統的輸入和輸出來調節系統的狀態。傳統科學的缺點在於,
它只能進行“黑箱操作”,不能解釋系統的內部組成成分和動力學過程。而系統生物學則
把生物系統化為“白箱”,不僅要了解系統的結構和功能,而且還要揭示出系統內部各組
成成分的相互作用和運行規律。
系統生物學對未來生物學的衝擊
未來的生物學可能在描述現象外,加上預測的能力
未來的生物學究竟是什麼?要回答這問題,一方面需要回顧歷史這面明鏡,在另一方面要
有科幻小說家的想象力。生物學一直被科學家們認為是描述性的科學,可是若回想化學發
展的過程,就會理解化學在發現周期表之前,也是描述性的科學。可是在經過多年的努力
後,已有許多原理形成,讓我們可以預測反應的行為。生物學在過去是局部性地研究少數
的基因,因此鮮有機會找出有用的規則作為預測之用。可是基因體分析計劃所發展出的巨
量分析技術,卻讓我們有機會可以作廣域性(global)的分析,因此在未來或許可以像化學
那樣做預測,而不是只有對現象的描述。
傳統生物學與化約論 (reductionism) 的觀點
分子生物學採用化約論的觀點,讓我們有機會觀察到許多前所未見的細節,讓我們有機
會提出反應機制來解釋現象。化約論假設一個複雜的系統可以分割為許多不會互相干擾的
子系統,因此只要將子系統研究清楚,就能了解複雜系統的行為。如果子系統仍然很複雜
,就用同樣的策略在子系統中再繼續分割,再一一擊破。這一套方法學固然使我們很成功
地由分子層次解釋反應運作的原理,而造成生物學上的突破。可是無限的化約真能解釋生
命現象嗎?
在使用化約論觀點的研究過程中,我們也發現子系統可能並非完全獨立,因此不具加成
性。生物體善用組合的策略,因此在執行紀錄在DNA中的指令時,也有許多隨機的組合。此
外,有時更有環境因素的影響。這就是為什麼每個人的指紋都不同;這也是為什麼少數抗
體基因,卻能產生上百萬種的抗體來抵禦各種入侵的異物。當隨機的因子出現時,化約論
不再能預測產生結果的機制,只能觀察最終的結果。化約論的死忠擁護者會辯解說這是因
為沒有找到所有的子系統,可是這種ad hoc的講法不過是提出一個無法測試的假說。我們
是不是應該承認任何一種方法學均非完美,而試由另一種觀點來看問題呢?
系統生物學與合成(synthesis)的觀點
系統生物學試圖由合成的角度看生物學,合成的觀點選擇面對子系統不獨立的可能性,
而希望尋找新的方法來解決子系統間交互作用的問題。就像是研究任何一個科學問題一樣
,解決這問題的第一個步驟是有系統地收集這些交互作用的信息。在過去採用化約論的觀
點看問題時,在用一個新的觀點詮釋問題時,才會注意到過去那些被忽視的信息。佛來明
發現抗生素時,並不是因為只有他觀察到這現象,而是因為只有他重視這現象。因此能夠
靈活地由不同的尺度,不同的觀點看問題時,才容易有新的發現。
傳統生物學假設細胞是一個黑盒子,我們可以加入物質(例如養份或抑製劑),或製作突
變株來擾動這未知的系統,再做實驗上的觀察。系統生物學在設計實驗時,所測量的數值
或許與過去所差不多,可是使用巨量分析的技術收集大量數據,而解釋數據的觀點也不相
同,甚至會引入許多生物學者不熟悉的分析方式。這種先收集大量數據,再做理論分析的
研究方法是比較有效率的方式,可在同樣的時間內由不同的專家“平行”地研究不同的路
徑。更重要的是這種研究方式,讓我們有機會觀察到許多路徑間的交互作用,這是在針對
單一路徑做研究時不容易看見的信息,因此才有機會由合成的角度分析生物學。在發展遺
傳工程學時,曾經淘汰了一批不習慣用這樣方式思考的人,也讓學習這種思考方式的人有
了飛快的進展。系統生物學的觀點是否相當於過去遺傳工程學對生物學的衝擊,不同的人
或許有不同的見解,可是可以確認的是它會發現一些過去忽視的現象,而且能與化約的觀
點互補。或許現在發展系統生物學的時機尚未成熟,可是我們是要創造時勢,或是在未來
追隨時代的潮流,是我們應該思考的問題。
生物信息學是過渡到未來生物學的重要工具
未來的生物學究竟是否會綜合化約與合成的觀點來建立生物學的理論架構雖然尚不明朗
,可以確認的是生物信息學的工具將像遺傳工程技術那樣的深入到每個生物學實驗室。這
種新的工具是這兩種觀點都需要的工具,它不但能被動地節省做分析的人力,也能主動地
引入“由信息驅動的生物醫學研究”。這種新的研究方式強調由數據中做觀察,比較,進
而提出假設,再以實驗方法做驗證。這種利用“信息探采(data mining)”的研究模式,
與傳統實驗生物學的搭配,將使我們能更有效率地發現新的現象,因此生物信息學將使我
們能更早地進展到有理論架構的未來生物學。
綜合而言,基因體分析等研究為我們累積了巨量的數據,而生物信息學可協助我們利用
這些數據加速做新的觀察之速率,因此有機會由整體的、合成的角度檢視生物學,而建立
所謂的系統生物學。未來的生物學很可能透過靈活地、交錯地運用化約與合成兩種觀點,
建立起生物學的理論架構,使傳統生物學由描述性的科學,轉型變成一種分析性的未來生
物學。
[1] Hood L. J Proteome Res, 2002 (published on web)
[2] Ideker T, et al. Science, 2001, 292:929
[3] Noble D. Science, 2002, 295:1678
[4] Arbeitman M N. Science, 2002, 297:2270
[5] Kitano H. Science, 2002, 295:1662