有趣的中位數(median)及其應用 |
送交者: gugeren 2015年10月03日09:55:27 於 [靈機一動] 發送悄悄話 |
1] 一道有趣的高考題與中位數的關係 先看一道上海市2009年高考題(轉引自樊一中《華爾街數學》),以引起大家對於中位數的興趣: 某地街道呈現東—西、南—北向的網格狀,相鄰街距都為1。兩街道相交的點稱為格點。若以互相垂直的兩條街道為軸建立直角坐標系,現有下述格點(-2,2),(-2,3),(3,1),(3,4),(4,5),(6,6)為報刊零售點。請確定一個格點(除零售點外)為發行站,使6個零售點沿街道到發行站之間路程的和為最短。 學過解析幾何的人,大概首先就會想到用“兩點之間的距離”公式來解這道題。但是“兩點之間的距離”公式形式是X坐標和Y坐標的平方和然後再開平方根的形式。這道題好像就是要找出這6個平方根之和為最小值時的情況。 腦子快的人立刻會想到,一個數的平方根的大小,與這個數的大小是一致的(這裡當然只考慮正數);就是說,我們可以把求最小平方根之和的問題,轉化為找到去除根號後的那幾個數之和為最小的問題。因此似乎可以把解題的思路改為:求12個含有X和Y各自的平方和(因為6個格點各有X和Y坐標)的最小值, 即找出 (X+2)、(X+2)、(X-3)、(X-3)、(X-4)、(X-6)、(Y-2)、(Y-3)、(Y-1)、(Y-4)、(Y-5)和(Y-6) 這12個代數式的平方之和為最小值。 把上述12個平方和化簡後是一個二元二次的函數,然後求它的最小值。 但是人們在這裡不知不覺地落入了題目設置的圈套:從已知的6個格點找出1個格點來,它們的坐標都是離散的數量。而二元二次函數則是一個連續量。兩者有本質的不同,因此解法也不同。 沒有看過樊一中這本書或他的博客的人,可能想不到答案的兩個坐標,就是X坐標的中位數和Y坐標的中位數。 列出數學式子: 題目是要找出 D = |x+2| + |x+2| + |x-3| + |x-3| + |x-4| + |x-6| + |y-2| + |y-3| + |y-1| + |y-4| + |y-5| + |y-6| 的最小值。 從網上搜到有關這道高考題的解法是錯誤的。 http://www.koolearn.com/shijuan/sj-94715-1.html 它的解法是分別去求6個X坐標和6個Y坐標的算術平均數,然後硬湊出與標準答案一致的答案來。這是把算術平均數與中位數兩者間的實質區別混淆了。真是誤人子弟啊! 算術平均數主要代表一個數集之中各個數的數值大小的趨勢,而中位數則表示一個有限數集之中數的分布狀況。兩者有實質的不同,儘管它們經常混在一起討論,名稱也很相近。 算術平均數與中位數比較,不大受隨機因素的影響,但是更容易受到極端值的影響。 這道考題中,如果有一個作為報刊零售點的格點處於很偏遠的地方的話,這時用算術平均數來計算,得出的結果就不是最短的了! 我們可以在這道題中再加一個格點(-8,-8)作為第7個報刊零售點。這時用中位數來解題,答案仍為(3,3);而用算術平均數來解,結果則是(4/7,13/7),四捨五入可以取為(1,2)。 把兩個結果代入原題內,這7個格點與(3,3)路程之和為45,而與(1,2)的路程之和則是48! 如果把答案換成與(1,2)相鄰的幾個點,例如(1,3)、(2,2)、(0,1)、(0,2)或(1,1),它們的結果都比(3,3)的45大! 舉一反三,根據上述這道題,類似地可以把它用到其他方面: --紐約市區街道縱橫交錯,也比較整齊。紐約市郵局每天需要送出的郵件非常多。如果郵遞員直接用汽車把郵件送到每家去,由於交通阻塞很不方便。紐約市郵局一般是把相鄰街道的郵件用汽車送到一個上鎖的大郵箱裡,然後讓郵遞員從這個大郵箱裡取出自己負責遞送地段的郵件,再分別送到各家。由此產生的問題就是:這個上鎖的大郵箱設在哪裡,可以使各位郵遞員取郵件和送郵件所走的總的路線為最短。 --Amazon、FedEx和UPS的生意就是物流。它們需要建立各地的分發倉庫(distribute center),以起到類似紐約市大郵箱的作用。分發倉庫建立的地點,就類似上述的結果。 當然,以上問題中,還需要考慮到設立地點的交通流量、人們的購買力、人口分布等情況,這些都可以作為權重(weights)考慮進去。 如果了解中位數的以下性質: 一個有限實數集的中位數,與數集之中各元素的離差的絕對值(absolute deviations)之和為最小。 就能更好地理解這道高考題了。 目前我在網上找到的最好的證明在以下的連接處: http://math.stackexchange.com/questions/113270/the-median-minimizes-the-sum-of-absolute-deviations The median minimizes the sum of absolute deviations 4個證明中,以第3個證明最清楚最簡單。 中位數更多的性質及其應用,請看下篇。 |
|
|
|
|
實用資訊 | |