設萬維讀者為首頁 廣告服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:諍友
萬維讀者網 > 教育學術 > 帖子
破解“基因”之謎
送交者: SeaSea 2007年09月30日00:00:00 於 [教育學術] 發送悄悄話

前不久,無業游民方舟子大嘴一張就破解了世界之謎,可惜前兩天他那一篇抄襲之做又顯示這個曾經的生化博士只怕連“基因”是啥玩意兒都沒搞醒豁,要不咱今天也來破解一下基因之謎?更或況方舟子的忠實擁躉南泥灣還牽強附會地計算那個0。1%,令人啞然失笑。我已經向南泥灣提及ENCODE PROJECT,但顯然並沒有多少人注意到這一重大遺傳學進展。在這裡,我向大家推薦兩篇文章:Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project。Nature 447, 799-816 (14 June 2007) 和What is a gene, post-ENCODE? History and updated definition。(Genome Res,2007 17: 669-681)。尤其是後面這篇綜述更為有趣且和今天的話題相關,特將其摘要拷貝如下,希望南泥灣能去仔細閱讀原文:While sequencing of the human genome surprised us with how many protein-coding genes there are, it did notfundamentally change our perspective on what a gene is. In contrast, the complex patterns of dispersed regulationand pervasive tranxxxxion uncovered by the ENCODE project, together with non-genic conservation and theabundance of noncoding RNA genes, have challenged the notion of the gene. To illustrate this, we review theevolution of operational definitions of a gene over the past century—from the abstract elements of heredity of Mendel and Morgan to the present-day ORFs enumerated in the sequence databanks. We then summarize the current ENCODE findings and provide a computational metaphor for the complexity. Finally, we propose a tentative update to the definition of a gene: A gene is a union of genomic sequences encoding a coherent set of Potentially overlapping functional products. Our definition sidesteps the complexities of regulation and tranxxxxion by removing the xxxxer altogether from the definition and arguing that final, functional gene products (rather than intermediate tranxxxxs) should be used to group together entities associated with a single gene. It also manifests how integral the concept of biological function is in defining genes. 

基因這個詞是生物學理論大廈的根基之一,鄙人早在10餘年前就對這個概念翻來覆去地考慮,今年ENCODE PROJECT發表重訪1%人類基因組序列之後我覺得“基因”這個概念或許應該這麼解釋:基因就是包括調控和得到轉錄的一段核酸序列。

我不是大牛,可能很多人會有些鄙夷地看着這麼一個無奈的解釋。那麼我這麼定義“基因”這個詞,它的外涵包括些什麼呢?首先,這裡提到的核酸序列,包括單鏈或雙鏈的DNA和RNA(諸多病毒的基因組為單鏈RNA,少數病毒基因組為單鏈DNA或雙鏈RNA);其次,得到轉錄的核酸序列甚至可以人為構造,並不存在於自然界中。例如轉“基因”抗病毒植物最初利用反義RNA對抗植物病毒的衣殼蛋白,就是將植物病毒衣殼蛋白編碼序列倒置於某些植物病毒啟動子序列之後;而後來則發現植物病毒的非編碼序列更容易激發RNA干擾機制,乾脆利用它們來作為轉基因的TARGET,獲得更好的抗病毒效果;最後,調控序列不僅僅指位於基因上游的啟動子序列,還包括散布於內含子中的增強子,以及下游3'末端的調控序列(甚至很可能就是啟動子的一部分,與上游的啟動子序列相輔相成,缺一不可)。調控序列併入基因的一部分是非常重要的,目前很多所謂的“選擇性拼接”中有多少其實正是由於轉錄因子選擇了不同的調控序列所致。

必須指出的是,即便這麼定義“基因”,人類基因組中基因數目幾何,仍然是個未知數,只能說比目前理論上的數目更多。南泥灣顯然也沒聽進去“今年之遺傳學已經不是去年的遺傳學”這話的意思,拿2001年的數據來說事。當然這又牽扯到生物信息學這個新生的玩意兒。生物信息學以獲得的數據為基礎來建立一個模型,然後再加以推廣,很不幸的是,這個模型的成功與否取決於數據的可靠性和廣泛性。顯然目前生物信息學是做不到這一點的,例如當時有人知道今天鑑定出的這幾百MIRNA了麼?有人報道非編譯RNA了麼?那時有人知道假基因也得到轉錄還不算,諸多基因的反義鏈還得到轉錄麼?即便是今天,生物信息學仍然捧着奶瓶,諸多結果在若干年後毫無疑義地屬於“偽科學”。

生物學雖然是有規律的,但其是動態的。南泥灣居然能來這麼一個加法公式“2450+3+40=25000 ”,I服了U!很難相信這能是一個搞生物學的人能計算出來的東西。說白了,生物系統之複雜性,決定了任何定量分析都是靠不住的,只能說基於以往的數據,能有一個什麼樣的趨勢。當更多的生物學現象發現之後,這個趨勢都很可能隨之改變。南泥灣編寫教科書的時候可以僵化一些,這個可以理解,畢竟是讓那些腦子裡對生物學沒有概念的學生跨入生物學這個領域,但如果你在這個領域裡面想發現些什麼,你這種僵化的思維方式只怕有些問題。

0%(0)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制