設萬維讀者為首頁 廣告服務 技術服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:紅樹林
萬維讀者網 > 五 味 齋 > 帖子
估算舟山蝙蝠Vir一千年內進化出酶切位點的幾率
送交者: 苦難與榮耀 2020年06月09日11:29:26 於 [五 味 齋] 發送悄悄話

估算結論

1 CoVZC45通過任意12次變異演化出酶切位點的幾率<1/10^52
2 CoVZC45一年內變異出酶切位點的概率<1/(10^36)
3 CoVZC45十年內變異出酶切位點的概率<1/(10^24)
4 CoVZC45一百年內變異出酶切位點的概率<1/(10^12)
5 CoVZC45一千年內變異出酶切位點的概率<25%

CoVZC45,指舟山蝙蝠類SARS冠狀病毒bat-SL-CoVZC45(簡稱CoVZC45),它與SARS-CoV-2基因序列相似度87.5%,被公認為是與SARS-CoV-2親緣關係最近,最有可能自然變異出SARS-CoV-2的冠狀病毒。

2017年,南京軍區軍事醫學研究所從採集於舟山的蝙蝠身上分離得到CoVZC45,2018年CoVZC45基因序列被上傳至國際基因庫。


引申結論

1.  由CoVZC45自然變異出酶切位點,進而演變成SARS-CoV-2是一個極度零概率事件。

如果,SARS-CoV-2是由與它親緣關係最近的CoVZC45自然變異而來的,那麼,沒有酶切位點的CoVZC45,應在被發現的2017年至2019年11月之間,在2年時間內自然變異出SARS-CoV-2具有的酶切位點。由本文估算結果來看,這是一個零概率事件。

2. 由任何與SARS-CoV-2有足夠親緣關係(或相似度),且無酶切位點的病毒自然演變為SARS-CoV-2,是一個極度零概率事件。

此結論適用於SARS-CoV(SARS病毒),CoVZXC21(另一種舟山蝙蝠病毒),RaTG13(石正麗的所謂雲南菊頭蝠病毒,如果它確實存在的話)等β譜系冠狀病毒。可參考文末“引申”部分。


準備

15862332677915724_65.PNG

SARS-CoV-2的酶切位點,恰好位於刺突蛋白(Spike蛋白,或S蛋白)的兩個亞基S1蛋白和S2蛋白的交界處,見上圖。以下將此交界位置記為S1/S2。

2019-ncov1.PNG



冠狀病毒的構造圖,病毒最外部的突起就是刺突蛋白(Spike,S),或棘突蛋白。


mqwpoint1.JPG


由上圖可見,SARS-CoV-2在S1/S2位置新增了四個氨基酸(殘基)“PRRA”,這四個氨基酸中的後三個“RRA”,與緊鄰的“R”的組合,構成了SARS-CoV-2的furin酶切位點標誌“RRAR”。圖中第二行是SARS-CoV-2的氨基酸序列(或叫蛋白序列),第四行是CoVZC45的氨基酸序列。還可以參考下面這個圖。

1582113547733.jpg

估算過程

A 估算CoVZC45通過任意12次變異演化出酶切位點的幾率

舟山蝙蝠類SARS病毒CoVZC45一共有近3萬個鹼基對;

假設:
a) CoVZC45每變異一次,平均有N個位置會發生改變;
a) 每一個位置的變異方式有增、減、換3種,每種方式發生的機會均等;

則,在CoVZC45的任意一次變異中,S1/S2位置出現變異的概率是N/30000;
S1/S2位置出現的變異恰為新增一個鹼基對的概率是(N/30000)*(1/3)=N/(30000*3)=N/(9*10^4);這裡10^4表示10的4次方。

(簡單起見,忽略在一次變異中,S1/S2位置同時新增2個以上鹼基的情況)

(補註:已完成偏差估計,該忽略造成的偏差不超出估算結果上限的2倍,或者說,可能的幾率上限不超過本估算結果上限的3倍。)

一個氨基酸對應三個鹼基對。

通過CoVZC45的任意三次變異,在S1/S2處新增出三個鹼基對的概率為(N/(9*10^4))^3=N^3/(9^3*10^12)=(N/9)^3*(1/10^12)

SARS-CoV-2的S1/S2處新增了四個氨基酸“PRRA”,第一個是P-脯氨酸,脯氨酸共有四種鹼基對組合(每種組合含三個鹼基對)。

RNA鹼基對有U-A、C-G、A-U、G-C四種,三個鹼基對的組合共有4*4*4=64種。在S1/S2處新增出的三個鹼基對屬於脯氨酸“P”的概率是4/64=1/16<1/10。

從而,通過任意三次變異,在S1/S2處新增出三個鹼基對,且此三個鹼基對屬於脯氨酸“P”的概率<(N/9)^3*(1/10^12)* (1/10)=(N/9)^3*(1/10^13)

通過任意12次變異,在S1/S2處新增出全部四個氨基酸“PRRA”的概率
P<{(N/9)^3*(1/10^13)}^4=(N/9)^12*(1/10^52)

[補註:
可以優化模型與算法,涵蓋一次變異產生多個鹼基對的情況。新模型+算法的估算結果為:通過不超過12次變異,在S1/S2處新增出全部四個氨基酸“PRRA”的概率 P<3*(N/9)^12*(1/10^52)。
它是原估算結果的3倍級別,二者數量級一致。或者可以說,原估算的偏差不超出一個數量級。
]


如果N=1,可計算得P<(1/2.8)*(1/10^63),即小於10的負63次方;
如果N=9,則P<(1/10^52),即小於10的負52次方。

以上是一個基礎性的估算。

下面進一步按不同時限估算。估算時,均取N=9;同時,假定CoVZC45一年內平均發生M=100次變異(參數M,N可能要根據相關研究進行調整)。

列出一個將反覆用到的數值:12!=12*11*10*9。。。*1=479001600~=4.8*10^8>4*10^8>10^8。

B CoVZC45一年內變異出酶切位點的概率<1/(10^36)

CoVZC45一年內發生約100次變異;
從100次變異中取12次變異的組合數<100^12/12!
CoVZC45一年內通過某12次變異進化出酶切位點的概率
P1<(100^12/12!)*P<(10^24/10^8)/10^52=1/(10^36)

C CoVZC45十年內變異出酶切位點的概率<1/(10^24)

CoVZC45十年內約發生100*10=1000次變異。
從1000次變異中取12次變異的組合數<1000^12/12!
CoVZC45十年內進化出酶切位點的概率
P10<(1000^12/12!)/10^52<(10^36/10^8)/10^52=1/(10^24)

D CoVZC45 100年內變異出酶切位點的概率<1/(10^12)

CoVZC45 100年內約發生100*100=10000次變異。
從10000次變異中取12次變異的組合數<10000^12/12!
CoVZC45 100年內進化出酶切位點的概率
P100<(10000^12/12!)/10^52<(10^48/10^8)/10^52=1/(10^12)

E CoVZC45一千年內變異出酶切位點的概率<25%

CoVZC45 1000年內約發生100*1000=100000次變異。
從100000次變異中取12次變異的組合數<100000^12/12!
CoVZC45 1000年內進化出酶切位點的概率
P1000<(100000^12/12!)/10^52<(10^60/(4*10^8))/10^52=25%


引申


以上算法只依賴如下特徵:
1. 估算對象是一個RNA單鏈冠狀病毒;
2. 其S蛋白S1/S2位置無酶切位點氨基酸;
3. 基因序列長度約為3萬個鹼基對;
4. 變異頻率約為100次/年,每次變異大約發生9個鹼基對改變

所以,本文的估算及結論對以下病毒皆適用:
SARS-CoV,與SARS-CoV-2相似度78.7;
CoVZXC21(bat-SL-CoVZXC21),2015年採集於舟山,與SARS-CoV-2相似度87.3%;
RaTG13(Bat-CoV-RaTG13),石正麗2020年1月23日公布此病毒,稱早在2013年即從雲南菊頭蝠糞便中分析得出,只有基因序列,沒有病毒毒株,與SARS-CoV-2相似度約96.2%。

本文的估算和結論還可推廣至所有與SARS-CoV-2有足夠親緣關係(或相似度),且無酶切位點的病毒(在SARS-CoV-2所在的β譜系,唯一具有酶切位點的是鼠肝炎冠狀病毒)。

0%(0)
0%(0)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制
一周點擊熱帖 更多>>
一周回復熱帖
歷史上的今天:回復熱帖
2019: 【七絕】三姓家奴
2019: 吉首公孫衍在不清楚秦國干的是啥之前本
2018: 安東尼·波登自殺,連美食都治癒不了人
2018: 中華民國的名字由來
2017: 老床被叫做liar之後,覺得自己vindicat
2017: 如果說打擊敘利亞是美國猶太勢力在運作
2016: ZT:高考作文命題,中國與法國的差距在
2016: 俺支持抵制蘭蔻,嘿嘿。
2015: 紅朝腦殘到什麼程度:陝西高考作文:給
2015: 我最近的餐後甜點酒是tequila&abso