笨人匯編 20160815
算術平均數(以下簡稱平均數)算法簡單,讀過小學算術的都會算。比如,2, 4, 6 三個數字的平均數是: (2+4+6)/3 = 12/3 = 4。
事實上,平均數不但在專業統計分析上,在日常生活上的應用也是到處可見,甚至到了濫用的地步。
平均數的魔力在於它的代表性。它體現了最大限度上的公平和民主:每個數據都均等地貢獻了自己的一份,既不多也不少。而且,每個數據對平均數的貢獻不止一次,而是兩次!首次是貢獻在數據之和的被除數上(上例的數字12),其次又參與在數據數目的除數上(上例的數字3)。
對於常態分布連續型數據而言,平均數概括了數據的集中趨勢,即揭示了數據輪廓。它是探索數據背後本質規律的第一個最重要的統計參數。
統計學發展史表明,平均數在導出統計學最重要的高斯分布和中心極限等定理方面,有着不可替代的太上皇地位。
平均數算法簡單,但要充分和深刻理解它的作用,沒有一點統計學知識會力有不逮。它在新聞媒體上的大量濫用,說明單單正確應用它也不是易事。比如,對於偏態分布的家庭收入數據,該用中位數,而非平均數來描述代表性。
從平均數的代表性同樣可以類推出政府的代表性。每個公民對選擇各級政府領導人的參與權力與程度,決定着一個國家的公平和民主程度。