设万维读者为首页 广告服务 技术服务 联系我们 关于万维
简体 繁体 手机版
分类广告
版主:诤友
万维读者网 > 教育学术 > 帖子
欧阳峰:用事实说话:循证决策
送交者: 欧阳峰 2015年03月24日16:48:37 于 [教育学术] 发送悄悄话

每年,美国联邦政府都要花大笔经费在社会服务上:帮助贫穷民众改善生活,找到工作,支持中小学教育,降低犯罪率等。这些钱或者直接发钱给受益人,或者花钱提供训练,辅导,医疗,社会调查等服务。2013年,联邦政府在这方面的花费超过四千亿美元。在过去半个世纪中,人均社会服务花费有巨大的增长,如下图所示。



美国联邦社会服务花费(人均)增长历史

复制自:http://www.heritage.org/research/reports/2014/03/do-federal-social-programs-work#_ftn20


那么,这样巨大的花费效果如何呢?怎样根据每个社会服务项目的成本收益来挑选更优越的理念和做法,制定更优越的社会政策呢?这就是“循证决策”(evidence based policy making)所要回答的问题。

虽然这个问题很自然,但却不容易回答。很多项目看上去顺理成章,但真实效果却出人意外。例如,美国有个实行了几十年的项目“赢在起跑线”(head start),为贫穷孩子提供学前班服务。我们都知道早期教育对孩子的智力发展和学习习惯培养十分重要,而穷人家父母忙于生计,没有精力也没有能力在家里很好教育孩子。所以提供学前班服务,可以帮助穷孩子有个更好的未来。这是理论。而事实如何呢?“赢在起跑线”项目在六十年代中期就已设立而且经过几次强化扩展。但一直到1998年才开始了系统,科学的评估。结果发现,参加过这个项目的孩子到了一年级和三年级时,他们的认知能力,社交能力和健康与没参加的孩子相比几乎没有任何提高。

评估社会服务项目很困难,因为一个人的行为和状况受很多因素的影响,而一个社会服务项目只能控制其中一些。所以对一个具体人的结果,很难说哪些是服务项目的功劳或罪过。而且,绝大多数社会服务项目的效果并不是天差地别,而是“润雨细无声”,必须经过仔细的定量观察才能知道。所以,评估社会服务用简单的因果判定方法是不行的。

因此,社会科学界发展了与 “循证医学”(evidence-based medicine)类似的方法。它把被研究人群随机地分配到受试组(接受社会服务)和对照组(不接受服务)。过一段时间后,通过比较两组的结果来评估社会服务的效果。这种评估方法早已被学术界所接受,在上个世纪末也对二十多个社会服务项目进行了短期或长期的评估。这些结果有的作为学术论文,有的作为政府部门报告发表。我们可以将此方法称为循证评估(evidence-based evaluation)。

但是评估结果出来后,怎样影响政策还是另一个问题。虽然政客们常常拿这些研究结果(往往还是断章取义的)来支持自己的立场,常年以来却没有一个根据评估结果制定和调整政策的常规流程。这里当然有种种原因。例如,联邦政府在分配经费时传统上不是根据项目的效果而是要照顾到各个议员的选区利益。又例如,取消现有的项目非常困难,因为必然有些人的利益要受到影响,所以这些人的反对会比其它人的支持强烈得多。而且执行项目的政府或民间机构也没有“评估”这种文化和经验,无法系统地推广“循证”方法。

这种情况到了近年才有改变。奥巴马上任后,推动国会通过了一系列新的社会服务项目(initialtives)。其中有六个大项目结合了循证评估的方法。这六个项目中包含近一千个子项目(programs),共计花费近五十五亿美元。循证评估主要用在两个地方。一个是挑选所资助的子项目。他们规定,子项目的申请要包括以往通过循证评估对其方法有效性的证明。大项目的主管单位——白宫预算办公室专门组织了专家团来评审这些子项目申请,而有效性的证据是其中重要一环。循证评估的另一个应用是在项目实施过程中继续审核其效果,并根据结果来决定继续,终止还是调整。他们还改变了以往按选区分钱的做法,而采取了提案竞争的办法来选择资助对象。这也是以往联邦项目管理中不多见的。

这六个大项目从2010年起陆续实施。几年下来,虽然评价项目本身的效果还为时过早,但循证评估的方法看来是奏效了。这其中,管理者们也克服了很多困难,特别是国会对于改变“分果果”传统的抵制。通过这些项目,循证评估的方法得到了一定程度的接受,也积累了这方面的技术人才和组织。虽然这六个项目只是所有社会服务中的极小一部分,但这是一个很好的开始。

前面说过了,对政府项目和政策加以评估并非新事。美国政府甚至有专门的部门(如国会预算办公室(CBO)和政府问责办公室(GAO)等)从事各种法案和政策的成本与效果评估(虽然不一定采用循证评估)。但由于种种原因,评估的结果往往不能转化为决策的依据。这种现象在社会服务以外的领域(如国防研究,外交政策等)也是如此。除了前面讨论过的一些障碍之外,我认为另一个重要原因是没有一个从头到尾的负责体系。常常是,发起研究的政府部门并不管实施研究的结论。他们花费巨款(一个简单的研究报告很容易就花掉几十万美元。严格的,包括对照组的循证研究就更加昂贵了)得到研究报告,往往就是签个字交给执行部门。而后者如何反应,就没人管了。另一个问题是政府内部壁垒森严,信息不流通。很多报告就因为一句话或一段话带有敏感性,就被划为“内部”或“敏感”级,不能公布于众。其实政府内部也不见得有人故意封锁信息。只是经办人员明哲保身,而没有人去倡导信息公开,就造成了过度保密的现象。这些问题关系到整个政府的文化和传统,冰冻三尺非一日之寒。所以推动循证决策是一项影响深远的努力。

循证评估是科学,有效的技术,但也不是万能的。过度强调循证,也可能会压制创新。毕竟社会学与医学不同,没有老鼠来做实验。每个新方法都要经历从未经证明到得到证明的过程。同时,评估也是很费钱,费力的工作。走到极端的话难免又成了另一道官僚“紧箍咒”,增加了繁文琐节。再者,民主社会的决策过程有很多考虑的因素。除了科学根据以外还有利益均衡分配和民众情绪的“非科学”的东西。所以,推广循证决策也要多加小心。

循证评估的执行和结果的解读都是技术含量很高的工作。这就要求政府与学术界的合作。上面说到的六个大项目,有些就由政府主导组织专家组成的团队来审定项目评估的计划和指导评估的过程。专家顾问也是美国政府运作的常态了。但在循证评估中,专家权力更大,不仅有建议权而且有相当的决定权。在这种情况下,专家对于公众的公信力也就更为重要。在涉及复杂专业问题的决策过程中,到底是听选民(及其议员代表)还是听专家的,这也是民主制度的一个新课题吧。

奥巴马总统执政快六年了。他的批评者除了抨击其理念和政策外,对他的执政能力也有很多质疑。奥巴马任上从健保网站崩溃到白宫警卫屡出状况,也给批评者提供了很多口实。然而,重视和推行这种“循证决策”,应该说是奥巴马政绩中的一个亮点。其实这个运动也不是从本届政府开始。例如,小布什在把推行几十年的教育扶贫政策改革为“不让一个孩子掉队”(no child left behind)法案时,就加进了很有争议的“问责”条款,对学校的标准考试成绩,特别是弱势群体学生的成绩,提出了定量标准。奥巴马任内更将其修改为“争上游”(race to the top)项目,通过提案竞争来决定资金去向。虽然奥巴马的社会服务政策带来很多党派之争,但对于循证决策的做法,国会中两党的态度并无太大不同。所以奥巴马的这个创举有望被继承下去,从而使得美国政府的政策制定过程更科学更有效。同时,我也希望这个“循证”的运动能从政府决策扩散到公众政治辩论中去,让政治辩论更多地基于事实和科学研究而不是煽情。所以,“循证决策”虽然目前只是一个尝试远未成为主流,但它是一个值得关注和鼓励的趋势。


参考书目:

Haskins, Ron, and Greg Margolis. Show Me the Evidence: Obama's Fight for Rigor and Results in Social Policy. Brookings Institution Press, 2014.

Muhlhausen, David B. Do Federal Social Programs Work?. ABC-CLIO, 2013.


有关博客:

提高执政效率:自适应 (上)

http://blog.creaders.net/fouyang/user_blog_diary.php?did=211192

提高执政效率:自适应(下)

http://blog.creaders.net/fouyang/user_blog_diary.php?did=212167


从金融危机看着政府的角色(上)

http://blog.creaders.net/fouyang/user_blog_diary.php?did=209313

从金融危机看着政府的角色(下)

http://blog.creaders.net/fouyang/user_blog_diary.php?did=210244


政经随想(4):民主与市场经济

http://blog.creaders.net/fouyang/user_blog_diary.php?did=91960

0%(0)
0%(0)
  信息出处? - Easygoing 03/24/15 (224)
标 题 (必选项):
内 容 (选填项):
实用资讯
北美最全的折扣机票网站
贝佳药业美国专利【骨精华】消关节痛、骨刺、五十肩【心血通】改善心绞痛
一周点击热帖 更多>>
一周回复热帖
历史上的今天:回复热帖
2014: 侃侃【捣练子】这个美妙的词牌
2014: 无锡奥思达周萱根本没有研发干细胞能力
2013: 第一届万维哲学讲座胜利闭幕
2013: 2013-64 = 1949; 2013-92 = 1921
2012: 史上最牛审稿意见
2012: ZT: 世界上最牛的博士论文就应该是这样
2011: 法律欺诈美国登峰造极?
2011: Misinterpretations of GR
2010: 好像有人说过,信基督不救国但救人,看
2010: 从袁隆平获奖谈中国人