2020年1月30日,美國匹茲堡大學高級研究員詹姆斯·萊昂斯-魏勒 (James Lyons-Weiler)在其個人網站發表了一篇題為“On the Origins of the 2019-nCoV Virus, Wuhan, China”的文章,
https://jameslyonsweiler.com/2020/01/30/on-the-origins-of-the-2019-ncov-virus-wuhan-china/
這篇文章還有一篇關聯的輔助分析文章:Moderately Strong Confirmation of a Laboratory Origin of 2019-nCoV
https://jameslyonsweiler.com/2020/02/02/moderately-strong-confirmation-of-a-laboratory-origin-of-2019-ncov/
Lyons-Weiler的主要觀點包括:
1)2019-nCoV與最相似的蝙蝠冠狀病毒(舟山蝙蝠病毒CoVZC45)之間缺乏足夠的基因序列同源性;
2)新冠基因組中的核苷酸子序列INS1378與SARS刺突蛋白的序列高度相似;
3)INS1378與實驗室通用載體pShuttle-SN質粒也具有顯著的序列相似性,該載體用途之一是生產SARS疫苗;
4)INS1378不太可能存在於其它冠狀病毒中;
5)2019-nCoV非常可能是來自實驗室的重組病毒,是作為SARS疫苗而製造的。
Lyons-Weiler的發現與判斷揭示或折射出部分的本質和真相,與此同時,他的某些看法也有欠準確、深刻。
具體而言,我的判斷或結論有以下四點:
1。INS1378與實驗室載體pShuttle-SN的相似性,與SARS刺突蛋白的相似性,都不夠充分;
2。INS1378是SARS-CoV-2的S1蛋白的一部分,同時,INS1378包含S1蛋白的RBD(Receptor Binding Domain,受體結合域)的大部分。
3。SARS-CoV-2的S1蛋白的RBD,克隆自SARS-CoV的S1蛋白的RBD(實際克隆的是一個比RBD要寬的區域,不妨稱之為擴展RBD),實驗室製作SARS-CoV-2時,對克隆自SARS-CoV的擴展RBD還做了少量的其它基因編輯。Lyons-Weiler觀察到的INS1378與SARS-CoV刺突蛋白(即S蛋白,Spike蛋白,包括S1、S2兩部分)的相似性,其實來自SARS-CoV-2的擴展RBD,與SARS-CoV的擴展RBD的高度同源性。
4。在將SARS-CoV的擴展RBD,克隆到SARS-CoV-2中時,使用的是已克隆有SARS-CoV的S1蛋白片斷的實驗室載體pShuttle-SN,這就是Lyons-Weiler觀察到的,INS1378與pShuttle-SN存在相似性的原因。
(對SARS-CoV-2是否是一種疫苗用途的人造病毒,本文不展開評論。)
先分析、說明結論-“1。INS1378與實驗室載體pShuttle-SN的相似性,與SARS刺突蛋白的相似性,都不夠充分;”理由如下。
a)INS1378與SARV-CoV刺突蛋白(S蛋白)的序列一致性(可匹配度)並不高,僅為67.77%;它與pShuttle-SN的序列一致性也同樣僅為67.77%。事實上,INS1378與pShuttle-SN,與所有SARV-CoV病毒株基因序列的一致性都是67.77%。對INS1378來說,pShuttle-SN與SARS-CoV並無不同。如果可以說,INS1378來自pShuttle-SN,那麼,也可以說INS1378來自SARS-CoV。
下圖是用NCBI(National
Center for Biotechnology
Information)工具Blast得到的INS1378在基因數據庫中的搜索匹配結果列表(部分),中間一行是INS1378與“Expression
vector
pShuttle-SN”的基因序列匹配情況,二者的序列一致性(或者說可匹配度)為67.77%。這一行上下兩側是INS1378與一些SARS-CoV病毒株的匹配情況,匹配度也都是67.77%。
b)INS1378與兩種舟山病毒CoVZC45,CoVZXC21的一致性分別為70.31%,69.76%,皆高於其與pShuttle-SN或SARS-CoV的一致性(67.77%)。因此,與其說INS1378來自pShuttle-SN,那麼,還不如說INS1378來自CoVZC45或CoVZXC21。參見下圖。
c)Expression
vector
pShuttle-SN質粒基因序列共有5607個鹼基對,它自編號945開始的一段長為1525的鹼基對序列,與SARS-CoV(以病毒株SARS
coronavirus
BJ162代表)自編號21447(位於SARS-CoV的S蛋白的起始位置21493之前,相距46個鹼基對)開始的一段長為1526的鹼基對序列高度匹配,在1526個對應位置上,匹配的鹼基對有1520個,一致度(匹配度)高達1520/1526=99.61%。下圖為使用Blast工具得到的比照結果截圖(匹配段序列較長,截圖只顯示了前面一小部分匹配段)。
Blast Job Title AY862402:Expression vector pShuttle-SN, complete...
Expression vector pShuttle-SN與SARS-CoV(SARS coronavirus BJ162)基因序列匹配情況
下圖是SARS-CoV中,與pShuttle-SN高度匹配區域的位置。
d)Expression
vector
pShuttle-SN與SARS-CoV二者長為1525/1526的高度匹配區域,包含它們各自與INS1378(含1378個鹼基對)的匹配區域,因而,二者與INS1378的匹配區域,幾乎一模一樣,這就是INS1378與二者的一致性相同,皆為67.77%的原因。
e)Expression
vector pShuttle-SN與SARS-CoV高度匹配的原因是,Expression vector
pShuttle-SN中那段長度為1525的鹼基對序列,本來就是從SARS-CoV的S蛋白中克隆來的。相關背景是,在實驗室用SARS-CoV的S蛋白與(缺陷型)腺病毒合成SARS疫苗時,其中一個實驗步驟是,將SARS-CoV的S1蛋白的一部分(例如,鹼基對編號from
−57 to 1468, SN),克隆到pShuttle-SN質粒中,這將得到一種含有SARS-CoV
S1蛋白片斷的pShuttle-SN重組質粒,它就是Expression vector
pShuttle-SN,它所含的S1蛋白片斷,就是它與SARS-CoV的高度匹配部分。Expression vector
pShuttle-SN的基因序列,由疫苗製作單位-中山大學腫瘤防治中心,於2004年12月21日提交至國際基因庫GenBank。參見下圖。
下圖是腺病毒SARS疫苗的專利情況。
這是腺病毒SARS疫苗的製備方法。
請大家注意一個事實:早在2003-2004年間,中山大學就已經能夠用SARS-CoV的S蛋白+腺病毒骨架來合成人工病毒(疫苗)了。
由以上5點可見,Lyons-Weiler對“新冠的INS1378”與“實驗室通用載體pShuttle-SN”關係的判斷比較模糊,有欠準確和深刻。
那麼,SARS-CoV-2中的INS1378與實驗室通用載體pShuttle-SN之間到底有沒有關係?如果有關係,是什麼樣的關係?這種關係是如何產生的?下面回答這幾個問題。
使用Blast比對Lyons-Weiler提供的INS1378序列與SARS-CoV-2基因序列可知,核苷酸(鹼基對)序列INS1378在SARS-CoV-2基因序列中的起始位置是21643,終了位置是23020,它正好落在SARS-CoV-2的S1蛋白對應的基因序列內。INS1378在SARS-CoV-2(2019-nCoV)基因序列中的位置見下圖。
容易推算出,INS1378在S1蛋白基因序列中的起始位置是95(大致對應第95/3=32個氨基酸),終了位置是1472(大致對應第491個氨基酸),還有一個很重要的關係:INS1378涵蓋了大部分的RBD(Receptor-Binding-Domain)。
INS1378在SARS-CoV-2的S1蛋白中的位置,及它與RBD的位置關係及重合情況。上半圖編號為鹼基對編號,下半圖編號為氨基酸編號。一個氨基酸(amino acids)對應三個鹼基對。
至此,我們可得出本文的結論-2。
2。INS1378是SARS-CoV-2的S1蛋白的一部分,它包含S1蛋白RBD(Receptor Binding Domain,受體結合域)的大部分。
接着看本文的結論-3。
3。SARS-CoV-2的S1蛋白的RBD,克隆自SARS-CoV的S1蛋白的RBD(實際克隆的是一個比RBD要寬的區域,不妨稱之為擴展RBD),實驗室製作SARS-CoV-2時,對克隆得來的擴展RBD還做了少量的其它基因編輯。也說是說,SARS-CoV-2的擴展RBD乃至S1蛋白,與SARS-CoV的擴展RBD或S1蛋白,有很高的同源性。Lyons-Weiler觀察到的INS1378與SARS-CoV的相似性,其實反映的是SARS-CoV-2與SARS-CoV二者擴展RBD的高度同源性。
不對此結論作過多的展開分析了,只給出兩個簡明的依據。
1)2020年1月21日,來自中國科學院上海巴斯德研究所等單位的徐心恬、陳萍、王靖方等學者在SCIENCE
CHINA Life
Sciences(《中國科學:生命科學》)上發表了一篇論文,題為“源於武漢爆發的新型冠狀病毒的進化及其棘突蛋白對人類傳播風險的建模”(Evolution
of the novel coronavirus from the ongoing Wuhan outbreak and modeling
of its spike protein for risk of human transmission)。論文的結論之一是:
儘管新冠與SARS-CoV二者S蛋白的總體同源性較低,但二者的RBD區域卻有較高的同源性。
2)2020年1月30日,中國疾控中心、山東第一醫科大學的陸柔劍等科研人員在柳葉刀(The
Lancet)上聯合發表了一篇題為“Genomic characterization and epidemiology of 2019
novel coronavirus: implications for virus origins and receptor
binding”(2019年新型冠狀病毒的基因組表徵和流行病學:對病毒起源和受體結合的啟示)的論文,論文的結論之一是:
雖然2019-nCoV(即SARS-CoV-2)與SARS-CoV的親緣關係較遠,但同源性建模顯示,2019-nCoV具有與SARS-CoV相似的受體結合域結構,儘管某些關鍵殘基處存在氨基酸差異。
Lyons-Weiler不僅觀察到INS1378與SARS-CoV的相似性,還觀察到INS1378與pShuttle-SN的相似性,這又是為什麼呢?因為在將SARS-CoV的(擴展)RBD,克隆到SARS-CoV-2中時,使用的工具是實驗室通用載體pShuttle-SN,pShuttle-SN中已克隆有SARS-CoV含RBD的S1蛋白片斷(這與製作SARS疫苗時的做法如出一轍)。所以INS1378與SARS-CoV的相似性,等同於INS1378與pShuttle-SN的相似性。這就是本文的結論4。
綜上所述,SARS-CoV-2基因序列的子序列INS1378的來源是:一部分來自CoVZC45(2017年發現的舟山蝙蝠冠狀病毒,製造SARS-CoV-2的底版病毒)的S1蛋白,一部分來自SARS-CoV的S1蛋白(擴展RBD),INS1378中還有若干其它的基因編輯。也就是說,INS1378隻是部分來自SARS-CoV或pShuttle-SN,它來自CoVZC45的比例應該還稍稍多於來自SARS-CoV或pShuttle-SN的比例。
為什麼SARS-CoV-2要克隆SARS-CoV的RBD呢?因為製作SARS-CoV-2的底版病毒--舟山蝙蝠冠狀病毒CoVZC45的RBD(Receptor-Bind-Domain)不能與人類細胞受體ACE結合,因而該病毒不能感染人,克隆一個能與ACE2結合的RBD,才能將病毒改造成能感染人的病毒。
雖然Lyons-Weiler對INS1378與pShuttle-SN關係的判斷有欠準確、深刻,但他的判斷仍折射出SARS-CoV-2的來源真相。Lyons-Weiler文章中有借鑑價值的內容還包括:
a)2019-nCoV(SARS-CoV-2)對應的進化樹分支的bootstrap值(自展值)較低,僅為76,(可能)是冠狀病毒家族成員中最低的。這說明SARS-CoV-2進化樹分支(自然進化意義上)的可信度低,也說明SARS-CoV-2基因序列中,演化來源不明的成分比例高。
b)2019-nCoV與蝙蝠冠狀病毒的基因序列同源性較差,且序列一致性關係不連貫,存在明顯的間斷gap,這也不是自然進化應有的現象。
SARS-CoV-2與舟山蝙蝠病毒CoVZC45序列一致性關係dot plot圖(來自Blast)。
圖中有非常明顯的間斷gap,這一間斷gap正好對應着來自SARS-CoV的擴展RBD。
註:NC_045512代表SARS-CoV-2(NCBI refseq),MG772933代表CoVZC45(Accession number);
在與SARS-CoV-2存在進化可能性的冠狀病毒中,CoVZC45與之相似度最高。
眾多證據指向一個結論:SARS-CoV-2是實驗室製造的。想了解相關文章及更多證據的朋友,請移步我的博客。
(全文完)
(主要內容初作於6月25日,有修改)