關於淘寶網正品率的統計分析-教育學術-萬維論壇-萬維讀者網（電腦版）

送交者: youkongliao 2015年01月29日13:06:14 於 [教育學術] 發送悄悄話

先簡單介紹一下背景。

1月23日，工商總局在其官方網站上，發布《2014年下半年網絡交易商品定向監測結果》。報告顯示，2014年8月至10月，國家工商總局網監司委託中國消費者協會開展網絡交易商品定向監測，共完成92個批次的樣品採樣，其中，淘寶網樣本51個，正品率為37.25%。京東商城、天貓、1號店的樣本數量分別為20個、7個和10個，正品率分別為90%、85.71%和80%。聚美優品的3個樣本均為正品;中關村電子商城的1個樣本為非正品，正品率0%。

1月27日，一位80後淘寶網運營小二發出公開信，直接就這份報告所存在的程序性問題點名該司劉紅亮司長，認為這份報告不僅抽樣太少、邏輯混亂，。。。。該信指出，“您看，貴司此次共抽檢了92批次商品。某電商只抽查了1件，得出了正品率為0的結論。另一家電商只抽查了3件，得出正品率100%的結論。而在淘寶網上一共抽檢了51件商品，得出了淘寶僅37%的正品率，也就是63%的售假率。可是，淘寶日均在線商品總量超過10億件。。。。

詳細報道請見http://finance.ifeng.com/a/20150127/13461835_0.shtml

我們先對陶寶網的數據小結一下：商品總量N= 10億；樣本量n = 51；樣本中正品率 phat = 37.25%，導出樣本中正品數x = n*phat = 19.

雙方結論：

工商總局：因為樣本正品率phat = 37.25%，所以商品總量中的正品率 p = 37.25%。

陶寶網：因為樣本量n = 51太小，而N = 10 億很大，所以由這個樣本得出的結論不可靠。

以下我們嘗試從統計學角度給出一個嚴格評估。

商品總量中的正品率 p 是一個待確定且不可觀測的參數。用 phat簡單估計p，基本上不可能正確。換句話說，用一個點（phat）去估計另一個點（p），錯誤的概率極大。因而，工商總局的結論是不可靠的。也就是說，真正的 p 不等於37.25%。但差了多少呢？

N = 10 億，而n = 51太小, 因而這樣的樣本不可用。此結論同樣有問題。n = 51 是否小不是問題，如果此樣本是簡單隨機樣本（這方面信息不全，此處假設它成立），我們可以用精確置信區間估計p。想象一下，用炸彈炸人（區間估計）和用子彈打人（點估計），哪個更可靠。根據Wang（2014，Statistica Sinica， 24，p1389-1410），當x = 19，正品率p的95%精確置信區間等於[0.247， 0.513]。也就是說，我們以95%的信心聲稱陶寶網商品總量中正品率是在24.7%和51.3%之間。

這樣的正品率顧客上帝們能接受嗎？淘寶網運營小二，你怎麼看？

應用Wang的方法於其他商家，

京東商城：n = 20， x = 18， p的95%置信區間等於[0.683， 0.982]

天貓：n = 7， x = 6，p的95%置信區間等於[0.445， 0.993]

1號店：n = 10，x = 8，p的95%置信區間等於[0.445， 0.964]

聚美優品：n = 3， x=3，p的95%置信區間等於[0.368， 1.00]

中關村電子商城：n = 1，x = 0，p的95%置信區間等於[0，0.95]。

以上結論是基於樣本是隨機樣本的假設導出的。樣本量n是多大和結論是否正確無關。總結一下，京東商城的正品率在以上商家中有最大的下界68。3%，因而正品率最高。呵呵，還是京東靠譜。

註：用Wald漸進置信區間估計p不能保證正確的置信度（95%），所以不用。

0%(0)

test　　/無內容 - hare 02/16/15 (238)

	實用資訊

回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐：海航獲五星
海外華人福利！在線看陳建斌《三叉戟》熱血歸回豪情築夢 高清免費看無地區限制

一周點擊熱帖

更多>>

一周回復熱帖

歷史上的今天：回復熱帖

2014:	亂侃向《物理評論》Chief-in-Editor 的
2014:	英語中感嘆詞或詈詞的委婉說法
2013:	比較政策：人權的自然屬性與社會屬性
2013:	指導一下如何讓“龍芯”成功
2012:	走近量子（6）幫倒忙的貝爾
2012:	天蓉：陰謀政治-60-警商勾結顧客遭殃
2011:	哈佛才女楊元寧-王永慶的外孫女
2011:	重慶房地產稅不合理的地方
2010:	富士康為何總把員工逼死
2010:	粒子 --- 自旋的弦（合併）