有趣的中位数(median)及其应用 |
送交者: gugeren 2015年10月03日09:55:27 于 [灵机一动] 发送悄悄话 |
1] 一道有趣的高考题与中位数的关系 先看一道上海市2009年高考题(转引自樊一中《华尔街数学》),以引起大家对于中位数的兴趣: 某地街道呈现东—西、南—北向的网格状,相邻街距都为1。两街道相交的点称为格点。若以互相垂直的两条街道为轴建立直角坐标系,现有下述格点(-2,2),(-2,3),(3,1),(3,4),(4,5),(6,6)为报刊零售点。请确定一个格点(除零售点外)为发行站,使6个零售点沿街道到发行站之间路程的和为最短。 学过解析几何的人,大概首先就会想到用“两点之间的距离”公式来解这道题。但是“两点之间的距离”公式形式是X坐标和Y坐标的平方和然后再开平方根的形式。这道题好像就是要找出这6个平方根之和为最小值时的情况。 脑子快的人立刻会想到,一个数的平方根的大小,与这个数的大小是一致的(这里当然只考虑正数);就是说,我们可以把求最小平方根之和的问题,转化为找到去除根号后的那几个数之和为最小的问题。因此似乎可以把解题的思路改为:求12个含有X和Y各自的平方和(因为6个格点各有X和Y坐标)的最小值, 即找出 (X+2)、(X+2)、(X-3)、(X-3)、(X-4)、(X-6)、(Y-2)、(Y-3)、(Y-1)、(Y-4)、(Y-5)和(Y-6) 这12个代数式的平方之和为最小值。 把上述12个平方和化简后是一个二元二次的函数,然后求它的最小值。 但是人们在这里不知不觉地落入了题目设置的圈套:从已知的6个格点找出1个格点来,它们的坐标都是离散的数量。而二元二次函数则是一个连续量。两者有本质的不同,因此解法也不同。 没有看过樊一中这本书或他的博客的人,可能想不到答案的两个坐标,就是X坐标的中位数和Y坐标的中位数。 列出数学式子: 题目是要找出 D = |x+2| + |x+2| + |x-3| + |x-3| + |x-4| + |x-6| + |y-2| + |y-3| + |y-1| + |y-4| + |y-5| + |y-6| 的最小值。 从网上搜到有关这道高考题的解法是错误的。 http://www.koolearn.com/shijuan/sj-94715-1.html 它的解法是分别去求6个X坐标和6个Y坐标的算术平均数,然后硬凑出与标准答案一致的答案来。这是把算术平均数与中位数两者间的实质区别混淆了。真是误人子弟啊! 算术平均数主要代表一个数集之中各个数的数值大小的趋势,而中位数则表示一个有限数集之中数的分布状况。两者有实质的不同,尽管它们经常混在一起讨论,名称也很相近。 算术平均数与中位数比较,不大受随机因素的影响,但是更容易受到极端值的影响。 这道考题中,如果有一个作为报刊零售点的格点处于很偏远的地方的话,这时用算术平均数来计算,得出的结果就不是最短的了! 我们可以在这道题中再加一个格点(-8,-8)作为第7个报刊零售点。这时用中位数来解题,答案仍为(3,3);而用算术平均数来解,结果则是(4/7,13/7),四舍五入可以取为(1,2)。 把两个结果代入原题内,这7个格点与(3,3)路程之和为45,而与(1,2)的路程之和则是48! 如果把答案换成与(1,2)相邻的几个点,例如(1,3)、(2,2)、(0,1)、(0,2)或(1,1),它们的结果都比(3,3)的45大! 举一反三,根据上述这道题,类似地可以把它用到其他方面: --纽约市区街道纵横交错,也比较整齐。纽约市邮局每天需要送出的邮件非常多。如果邮递员直接用汽车把邮件送到每家去,由于交通阻塞很不方便。纽约市邮局一般是把相邻街道的邮件用汽车送到一个上锁的大邮箱里,然后让邮递员从这个大邮箱里取出自己负责递送地段的邮件,再分别送到各家。由此产生的问题就是:这个上锁的大邮箱设在哪里,可以使各位邮递员取邮件和送邮件所走的总的路线为最短。 --Amazon、FedEx和UPS的生意就是物流。它们需要建立各地的分发仓库(distribute center),以起到类似纽约市大邮箱的作用。分发仓库建立的地点,就类似上述的结果。 当然,以上问题中,还需要考虑到设立地点的交通流量、人们的购买力、人口分布等情况,这些都可以作为权重(weights)考虑进去。 如果了解中位数的以下性质: 一个有限实数集的中位数,与数集之中各元素的离差的绝对值(absolute deviations)之和为最小。 就能更好地理解这道高考题了。 目前我在网上找到的最好的证明在以下的连接处: http://math.stackexchange.com/questions/113270/the-median-minimizes-the-sum-of-absolute-deviations The median minimizes the sum of absolute deviations 4个证明中,以第3个证明最清楚最简单。 中位数更多的性质及其应用,请看下篇。 |
|
|
|
|
实用资讯 | |