这次美国选举计票引起很大争议,最让人起疑的就是那著名的白登曲线,在大选日的后半夜突然直线上升,一举突破一直压它一头的平滑稳定的红色川总曲线。各主流媒体据此欢喜鼓舞宣告白登胜选,黑暗即将过去,曙光就在前头,美利坚和众国即将随白登入主白宫而进入伟大的社会主义新时代。
川总一方仗着七千多万甚至更多的美国选民的热烈支持,当然不服。川总本人和他的律师团队也指出投票计票过程的种种疑点,认为民党偷票作弊。更有顶尖数学统计学博士科研人员用各种算法对公开的投票数据进行统计分析,从数据分析结果也发现各种可疑信号,怀疑有人大选舞弊。这如果坐实,则形同政变,是操纵选举破坏民主的滔天大罪。当然白登方面也大都是藤校出身久经沙场的律师政客老油条,并不都是张口结舌口齿不清纵子枉法的老年痴呆患者,他们犀利反诘对方,证据呢?统计分析的疑点怎么能当证据呈堂?法官能听?笑话!
两造律师们唇枪舌剑各执一词,但是在我们这些底层搞工程的人看来,他们对工程统计的方法及应用其实可能都不大熟悉。一般来说,任何一组数据只要数据量足够大,总会服从某种规律,即便不服从任何规律即“完全随机”,那也是一种规律,一般都有办法验证或验否。把某种检验方法应用到既定数据上,如果没有出现检验信号,即表明该组数据通过了检验;反之如果出现了信号则该组数据没有通过检验。但无论数据是否通过该检验,都不说明该组数据或产生数据的工程过程确有问题,概因任何检验方法本身无法做到十全十美,总会有所谓一类和二类误差,也即出现检验信号但数据其实没问题;或数据实际有问题但反而没信号。当然出现这两类误差的概率应该比较小而且可控,否则该检验法也就不成其方法,查还不如不查。在工程应用上,如果用统计方法对某生产线进行检测或实时监测,一旦出现生产线可能有问题的信号,必须立刻停产并对生产线的现场设备操作人员等各方面做详细检查排障。如检查后发现生产线其实没问题,只是虚惊一场,那当然更好,但也得查清该虚假信号产生的原因并记录备案。在这些都查清之前,生产线不能启动,信号出现之后的产品只能作为潜在废品做进一步检查并根据检查结果再做相应处理。
联系到美国大选数据产生的疑点,从统计检验的功能来说,白登方面说数据统计疑点不能呈堂作为指控有人犯罪的证据,应该是对的。但从应用的角度来说,川总一方理直气壮要求凡有疑点的选票必须仔细复查,不漏一张真票不计一张假票,这不仅是确保选举公平完整的起码要求,也完全符合工程质量保障的规范。真心希望在下一步,各州长州务卿参众议员高院大法官能在排除所有统计以及其他疑点后再确认大选结果的合法有效。尤其是那平白无故突然直线上升的白登曲线,信号强烈,产生该信号的数据极为可疑,不可不查。