統計怎被用來撒謊-拜登在喬州選舉舞弊了?ZT | |
送交者: 一草 2021年02月23日14:12:44 於 [五 味 齋] 發送悄悄話 | |
導 讀 統計是怎樣撒謊的呢?看看2020大選時,統計專家是怎樣用數據推斷出拜登在喬治亞州選舉舞弊,從而被川普陣營、白宮官員和狐狸台當作寶貝般大肆宣揚的。 撰文:西嶺 馬克吐溫說過:世界上有三種謊言:lies, damned lies, and statistics (謊言,該死的謊言,統計數字)。 有一個笑話,前蘇聯最高領導人勃涅日列夫一次和美國總統尼克松一起,在紅場檢閱蘇聯武裝力量。在陸海空導彈部隊等各軍兵種威風凜凜、氣勢昂昂地走過之後,來了一隊衣冠不整、邊幅不修、舉止怪異的人,其中不少人還戴着眼鏡。尼克松感到很奇怪,問:這些人是誰?勃涅日列夫說:這些人是我的秘密武器。他們是統計專家。我準備把他們派到貴國去,他們對貴國造成的傷害,可以比飛機大炮導彈還要厲害。 統計是怎樣撒謊的呢?我們看一個例子。平均值是最常用的統計量。但這個統計量卻有個致命的毛病:容易受outlier(離群值)的影響。比如某個區有一百戶人家,平均家庭年收入是100萬美元,乍一看這是個很富裕的區域。殊不知,這個區里住了一個億萬富翁,年入9千萬。把他扣除之後,這個區的平均家庭年收入一下跌倒10萬美元多一點。 這個富翁就是個離群索居的outlier。如果不把他排除,平均值就是個很大的謊言。 在類似情況下,中位數比較不會撒謊,它比較不受outlier的影響。所以政府機構、研究機構在描述人群的收入水平時,多用中位數這個比較誠實的統計量。 不久前,有一個統計謊言的例子。在2020年美國總統大選中,民主黨人拜登贏得喬治亞州,他比川普多得0.2%(11779張)的普選票。而四年前,2016年,同樣在喬治亞州,川普比民主黨候選人希拉里•克林頓多得4.1%的選票。該州是傳統上的紅州,2020之前已經數十年都是共和黨總統候選人的囊中之物。於是乎,一位加尼福尼亞的統計“專家”,某某博士,大肆做了一番統計分析,計算了Z值,來推斷這兩個事件都發生的概率有多大。 結果他計算出Z值高達108,相應的概率是0.000000000000001,言下之意拜登不可能贏喬治亞,舞弊實錘了! 不出意外,這位專家的分析被川普陣營、白宮官員、狐狸台等當作寶貝般地反覆引用,被當作拜登舞弊的”科學證據”、”統計證據”,大肆宣揚。 事實上,該專家對z值的詮釋是典型的統計謊言。為方便理解,可以把此問題簡化為一個經典的拋硬幣的問題,假定一個硬幣,第一組試驗中拋足夠多的次數(比如1百萬次)以後,正面朝上的結果比反面朝上多4.1%,我們可以根據統計檢驗推斷此硬幣正反兩面不均,也許反面比正面多了一些污垢,也許正面比反面多了磨損。那麼,用同一枚硬幣在相同條件下進行第二組試驗,的確極不可能出現反面朝上比正面朝上的結果反超0.2%的情況,或者說這兩種試驗結果都發生的概率小到可以忽略。 但現在的問題是,我們有的是完全不同的兩枚硬幣!而且進行拋幣試驗的條件也完全不同。那位專家的整個分析是基於兩枚硬幣完全相同的假定,拋幣試驗的條件也完全相同。事實上,2020與2016完全不同:拜登不同於希拉里,川普也不是四年前的川普(2016年選民對他還不了解),美國的國內環境也不可同日而語。所以,用硬幣試驗的語言,是完全不同的兩枚硬幣、在不同條件下進行試驗,怎麼比較?那位專家如果不是自己不通,就是蓄意混淆,拿統計來蒙人。 簡言之,專家計算的高Z值證明的不是拜登舞弊,而是證明了拜登和希拉里是完全不同的候選人,並且2020年的川普不同於2016年的川普。 在所有的統計謊言當中,這類謊言最為惡劣。 所幸,這個謊言和其他同類謊言沒有得勢。如果得勢,對美國的損害確實超過勃涅日列夫的飛機大炮。 圖解美國 追蹤美國熱點時事新聞。 圖文解說,美華快報讓您握緊時代脈搏。 撰文:西嶺 編輯:Jing 本文由作者授權原創首發在《圖解美國》公眾號 |
|
|
|
|
實用資訊 | |
|
|
一周點擊熱帖 | 更多>> |
|
|
一周回復熱帖 |
|
|
歷史上的今天:回復熱帖 |
2020: | 我的榮光與驕傲:被踢出北大某級某系微 | |
2020: | 老聲常談:豬要過豬的日子,羊要過羊的 | |
2019: | 這是我看到的最清晰的巨人骨頭錄像。 | |
2019: | 不管怎樣中美貿易談判支那都是輸家 | |
2018: | 那個家宴的視頻是陳道明家嗎?很土豪啊 | |
2018: | 明成跟別人對話對到後來,就成了別人都 | |
2017: | 我想清楚了,共產主義就是撒旦編造的歪 | |
2017: | 福祿,當年左棍的定義是:給貪官打圓場 | |
2016: | 公孫明:一個勞工部聯邦探員對梁彼得事 | |
2016: | 男人夢中:二月二十三日看病記 | |