当前位置:首页 >

论刑事政策的评估
一、刑事政策评估的含义与意义
    
    (一)刑事政策评估的含义
    
    在政策科学界,“政策评估是一个存在广泛歧义的概念和方法。”[1]归纳起来,学者们对政策评估的理解主要有以下三种意见:一是认为政策评估的目的在于分析、比较各种各种不同的政策方案,指出每个方案的可行性及其相对的优缺点。二是认为政策评估贯穿于整个政策过程之中,而不仅仅发生于最后的阶段。三是认为政策评估是政策过程的最后一个阶段,其目的在于判断一项既定政策付诸实施以后是否产生了预期的政策效果,产生了哪些效果,还存在哪些问题,问题是如何产生的,如何才能解决这些问题。[2]与此相对应,对刑事政策的评估也可以有以上三种不同的理解。不过,在笔者看来,第一种观点所言其实是一种预测性的事先评估,把它归入政策制定中的决策及其可行性研究似乎更为合适;第二种观点将政策评估置于政策运行的全过程,其实也是将政策制定中的事先评估和政策执行中的事中评估包含其中,而事中评估似乎更适于归入政策执行中的监控研究。如果说事先评估和事中评估都属于广义上的政策评估的话,那么我认为事后评估这种狭义上的政策评估才是政策过程研究视野中的政策评估,因为此种评估较之事先评估和事中评估,在所依凭的材料和信息上更具有实在性和完整性,在所处的阶段上更具有独立性,因而其评估结论也就更具有客观性和科学性。正是从此意义上,本文倾向于前述第三种观点的思路,即政策评估应以“政策效果”为核心概念,立足于政策过程的最后一个阶段,回过头来考察政策过程的各个环节。不过,与前述第三种观点有所不同的是,本文的政策评估概念除了关注事实层面的评估,还特强调价值层面的评估。关于这一点,下文还将进一步论及。
    
    综上,我们可将刑事政策评估定义如下:所谓刑事政策评估,就是依据一定的标准和程序,运用一定的方式和方法,通过考察刑事政策过程的各个阶段、各个环节,对刑事政策的效率、效能、效益以及价值等进行检测和评价,以判断刑事政策的效果。该定义强调:1、刑事政策评估是一种在刑事政策执行完毕之后的已然基础上的回溯性考察和分析。[3]2、刑事政策评估不仅要运用实证技术方法进行事实评估,还要运用政治哲学方法进行价值评估。3、刑事政策评估虽然也要涉及刑事政策制定、执行等环节,但那都是为确定刑事政策效果服务的。
    
    何谓“刑事政策效果”?这里,又有必要澄清以下几种认识:一种认识是将刑事政策效果与刑事政策预定目标的实现程度等同起来。基于这种认识,刑事政策评估的范围就被局限在刑事政策预定目标的实现上,而无视刑事政策的其他效应。实际上,一项刑事政策执行后产生的效果和影响有时往往是多方面的,有些超出了政策制定者的预期,如果我们只关注刑事政策的预期目标,而对非预期目标(包括积极的和消极的两方面)不予考虑,则这种评估不可能是全面的和科学的。[4]另一种认识是将刑事政策效果与刑事政策输出相等同,即将刑事政策评估仅仅视为对国家行为的一种检测,而忽略与国家行为相关的各种环境的变化。“在社会的发展进程中,客观状况的实质性变化有时并不完全是某一政策推行后的必然结果。”[5]因此,评估某项刑事政策的效果,不能只单纯考察刑事政策过程中的国家行为,而应将刑事政策的输出放到政策周围的大环境中去分析,惟此才能确认刑事政策的实际效果。例如,我国改革开放以来的20多年里,伴随着社会结构的剧烈转型,各种犯罪呈显著上升趋势,是不是因此就对我国在这一时期出台的所有刑事政策都持否定态度呢?显然不能。还有一种认识是只注重刑事政策的产出与结果,而不计刑事政策的投入和成本。由于一定时期国家的刑事政策资源总是有限的,因而我们所讲的效果,应是适当成本基础上的效果,而不是说一项刑事政策,只要能取得好的效果,就可以不计成本,不计代价。事实上,正如有的学者所指出:“几乎所有的政策选择都有其经济原因。”[6]例如,假若只从预防和控制犯罪的角度来看,肯定是越多增加警力越好,但在实际确定警力时,却不得不考虑经济因素的制约。
    
    
    
    (二)刑事政策评估的意义
    
    
    
    刑事政策评估的意义,至少可以归纳为以下三个方面:
    
     首先,它可以向刑事政策制定者和执行者提供关于政策运行的基本信息。过去,由于我们不重视对刑事政策的评估,一项刑事政策执行完了就算了事,致使刑事政策制定者和执行者对刑事政策运行的一些基本信息缺乏客观的了解和把握,如刑事政策制定者不知道某项刑事政策的效益和成本究竟如何,资源配置是否合理,刑事政策执行者不知道政策执行的方法和策略是否得当,也不知道在现有政策资源条件下,是否还有更好的资源配置办法。另一方面,由于刑事政策制定者和执行者的局中人角色,他们对刑事政策的制定和执行质量往往不容易产生怀疑,若没有独立于他们的信息来提醒他们,往往会造成“当局者迷”的局面。正如有的政策学者所指出:“没有政策评估,政策运行就有可能陷入‘盲人骑瞎马,夜半临深池’的盲目状态。”[7]通过科学的刑事政策评估,就可以在资料收集和调查研究的基础上,经过分析和阐释,对刑事政策的价值、效益、效率、优缺点等作出判断,这种判断可以起到“旁观者清”的作用,对于政策制定者和执行者改进他们的工作是有重要参考价值的。
    
    其次,它能够为刑事政策的运行方向提供科学依据。一项刑事政策在经过一轮(或者一段)的运行后,可能会面临不同的命运:1、废止;2、继续存在;3、做适当的修正与调整;4、对处于试点阶段的或进行推广,或继续试点,或取消;等等。何去何从?这要取决于对该项刑事政策的效果评估。在经过认真的评估之后,对于那些被实践证明是失败了的刑事政策,或者弊远远大于利,或者说已经不再适应时代发展要求的过时的刑事政策,要果断地予以废止;相反,对于那些被证明是成功的刑事政策,或者利远远大于弊的刑事政策,就要继续予以推进和贯彻;而对于那些瑕瑜互见并且瑕又在很大程度上可以弥补的刑事政策,则要进行适当的修正与调整,使之在完善的基础上前进。对于那些处于试点阶段的刑事政策,如发现其试点效果好,则应在更大范围内加以推广和扩大;如试点效果不好,则应取消之;如试点效果一时还拿不准或尚不具备全面推广的条件,则可继续试点或在有限的范围内逐步予以推广。
    
    再次,它有利于社会公众对刑事政策的正确认识。社会公众对某项刑事政策的态度是制定、执行和调整该项刑事政策的重要参考,也是某项刑事政策是否具有正义性和合理性的重要依据,因而社会公众对一项刑事政策的去留具有重大的影响作用。然而,必须看到,社会公众既非刑事政策领域的专家,也不可能对刑事政策做专门的跟踪研究,因而他们对一项刑事政策的反映就往往受舆论宣传的影响、局部现象的左右,不可避免地带有表面性甚至片面性,如果让这种非科学的“群众意见”反过来又影响刑事政策的制定、执行和调整,将难以使刑事政策的运作走向良性循环。而科学、理性的刑事政策评估,则有利于引导社会公众正确认识某项刑事政策的效果,纠正其一些不正确的认识。正如美国开国先贤托马斯.杰佛逊所指出的:“我们政府的基础,源于民意。因此,首先应该做的,就是要使民意正确。为免使人民失误,有必要通过新闻,向人民提供有关政府活动的充分情报。进一步则要研究把新闻广泛地传递到全体人民中去。”[8]举例言之,晚近20多年来,我们不断发动的“严打”斗争,一个重要的决策依据就是群众拥护,但群众为什么拥护,因为他们看到“严打”期间可以使平时漏网的犯罪分子很快被抓获,“严打”期间公安机关不搞“以罚代刑”,“严打”期间一报案就能马上引起重视,等等。至于造成这些现象的前因后果是什么、“严打”能否从根本上解决社会治安问题、“严打”过多过滥会有一些什么副作用,这些他们并不会去深究。而要想对这些问题取得全面、正确的认识,就必须对“严打”政策进行深入细致的评估,实事求是地权衡“严打”的作用与得失,从而使群众在看到“严打”的积极一面的同时,对“严打”的消极一面也有充分认识,进而督促政府在“打与防”、“治标与治本”的关系上科学地分配政策资源。
    
     二、刑事政策评估的内容和方法
    
     (一)刑事政策评估的内容
    
    1、刑事政策效益评估,即评估刑事政策目标得以实现的程度。一项刑事政策的实施效果愈是离预期目标近,说明其效益愈好,反之,愈是离预期目标远,说明其效益愈不好。例如,美国1919年曾试图通过禁酒令来减少由于酗酒所发生的犯罪和其他危害行为,但实践的结果却不但没有解决决策者期望解决的问题,反而导致了新的严重犯罪,许多地方围绕制造、贩卖私酒而进行的犯罪活动大量增加,许多地方甚至形成了制造和贩卖私酒的犯罪集团。据有的学者介绍,“美国1919年通过的禁酒令,是导致美国社会黑社会集团产生的重要因素,大量的黑帮集团为了制造和贩卖私酒而进行了无数的犯罪行为,严重扰乱了社会秩序。”[9]因此,美国政府不得不在1933年撤消了禁酒令。
    
    2、刑事政策成本评估,即评估政策投入与产出之间的比例关系。这里的政策成本,包括整个刑事政策过程中所投入的全部政策资源,如人力、物力、财力和时间、风险等。在假定一项刑事政策效益不变的情况下,成本愈小,就说明该项刑事政策愈成功,反之,成本愈大,就说明愈不成功。例如,根据荷兰司法部完成的一项评估,认为增加警察力量耗费相对较大,但在减少犯罪方面的成效较小;而加强基层预防犯罪措施方面的投入相对较小,但是减少犯罪方面的成效却较大。因此,他们认为,有必要对致力于减弱导致犯罪的各种危险因素的基层预防犯罪措施增加投入,以便取得更大的预防犯罪的成效。该项评估意见被荷兰政府采纳。1994年,荷兰政府拨款100万美元,用于开展旨在减弱导致犯罪的各种危险因素的基层预防犯罪措施。[10]
    
    3、刑事政策影响评估,即评估刑事政策的实施对社会和公众以及政策受体所产生的各方面影响。影响有积极影响和消极影响,或曰正面影响和负面影响。刑事政策评估者既要重视刑事政策的积极影响或正面影响,也要重视其消极影响或负面影响,并要对消极影响或负面影响的形成原因进行剖析,进而提出如何将其降低到最低限度的改进意见。如果一项刑事政策的消极影响或负面影响已经超过了其积极影响或正面影响,又没有有效的改进意见,那么就要建议刑事政策决策者终止该刑事政策的下一轮运行。
    
    4、刑事政策过程评估,即对刑事政策运行的各个环节进行评估。实践是检验真理的唯一标准,经过政策实施,再回头考察政策过程的各个环节,对准确发现问题、有的放矢地改进工作有着重要的意义。因此,刑事政策评估就要对刑事政策问题的确定、刑事政策的制定、刑事政策的执行和刑事政策的监控等逐一进行考察,看对刑事政策问题的把握是否科学,刑事政策的制定是否规范,对刑事政策的监控是否有力,刑事政策的执行是否得当,并指出各自的完善方向。
    
    5、刑事政策价值评估,即对一项刑事政策在价值上所具有的意义进行评估。在政策评估的历史发展中,曾经有相当长的一个时期受行为主义的影响,只重视事实评估,而不重视价值评估,但自20世纪70年代以罗尔斯发表《正义论》为标志,产生了后行为主义和政治哲学的复苏,受此影响,一些政策学者开始对传统的政策评估的合理性提出质疑,他们指出:一项政策的效率、效能等固然重要,但这一切又是为了什么呢?因此,不弄清政策的价值问题,进而弄清楚政策的正当性、公正性等问题而去评估其效果,无异于本末倒置。“评估不应当只是真实的,它更应当是正义的。”[11]因此,现代刑事政策评估就不光是指刑事政策的效益、成本等事实层面上的评估,还应包括对刑事政策的公平、公正等价值层面上的评估。比如,1983年“严打”期间,全国人大常委会颁布了《关于严惩严重危害社会治安的犯罪分子的决定》,并规定:“本决定公布后审判上述犯罪案件,适用本决定。”也就是说,该决定突破了刑法典在时间效力上的“从旧兼从轻”原则,确立了“从新”原则,这种刑事立法政策若从价值层面上来分析,就有损公平原则,因为你不能用今天颁布的法去套别人昨天的行为,“可预期性”应是法治社会的一条基本原则。同样,我们现在经常看到最高人民法院和最高人民检察院出于打击某类犯罪的急迫需要,不断采取司法解释的办法,将一些行为超常规地解释为某一条文的涵盖范围,如最高人民法院1998年8月28日作出的《关于审理骗购外汇、非法买卖外汇刑事案件若干问题的解释》,将骗购外汇、非法买卖外汇的行为解释为“非法经营罪”的内容,2001年3月29日又通过司法解释将传销或者变相传销行为归入“非法经营罪”的范围,此种司法解释实际上是变相地行使了立法权,但在时间效力上却一直是可以溯及既往,应当说,从公平、公正的角度看,这类刑事司法政策也是值得质疑的。[12]
    
    
    
    (二)刑事政策评估的方法
    
    
    
    政策科学者给我们提供了许多政策评估的方法,如有的认为政策评估的方法有前后对比法、对象评定法、专家判断法和自我评定法,[13]有的认为政策评估的方法有对比分析法、成本效益分析法。统计抽样分析法、模糊综合分析法,[14]还有的认为政策评估的方法应包括矛盾分析法、加权评价法、前后对比法,[15]等等。新近有的刑事政策学者也对刑事政策评估的方法做了探讨,认为刑事政策评估的方法应包括定性与定量相结合的方法、资料收集与综合分析相结合的方法、比较分析方法、历史分析方法、价值分析方法和成本效益分析方法。[16]可见,刑事政策评估的方法可以有多种,也可以从不同角度去划分。这里,笔者着重介绍以下两种方法:
    
    
    
    
    
     1、前后对比法
    
    前后对比法是刑事政策评估的基本方法。该方法是将刑事政策执行前后的有关情况进行对比,从中测度出政策效果的一种定量分析法。它通过一定的参数对比,使人们对刑事政策执行前后的变化有一个较为清晰的印象。例如,美国犯罪学家塞林(Thorsten Sellin,1896—1994)对废除死刑效果的研究,就是运用这一方法的结果。在20世纪50、60年代,塞林对死刑的威慑效果进行了广泛研究,他对美国11个州废除死刑前后的杀人率进行比较后指出,没有证据表明,废除死刑会导致杀人率的增加或者重新恢复使用死刑会导致杀人率的下降。[17]
    
    在具体运用上,这种方法又可进一步分为四种模式:
    
    (1)简单“前—后”对比分析。这种模式是将政策对象在接受政策作用后可以衡量出的变化值减去之前可以衡量出的值。该方式的优点是简单、方便、明了;缺陷是不够精确,无法将政策执行所产生的效果和其他因素如政策对象自身因素、外在因素、偶发事件、社会变动等所造成的效果加以明确区分。(见图一)
    
    政策执行前
    
    政策执行后
    
    A1
    
    A2
    
    A2­A1=政策效果
    
    前——后
    
    时 间
    
    图一 简单“前—后”对比分析
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    (2)“投射—实施后”对比分析。这种方式是将刑事政策执行前的倾向线Q1、Q2投射到刑事政策执行后的某一点A1上,并将这一点同刑事政策执行后的实际情况A2点进行对比,以确定刑事政策的效果。这种方式由于考虑到了非政策因素的影响,因而较前一种方式前进了一步,但困难在于如何准确地确定某一点A1会发生的情况,即建立起刑事政策执行前的趋向线。(见图二)
    
    
    
    政策执行前
    
    政策执行后
    
    A2
    
    A1
    
    趋向线
    
    Q1
    
    Q2
    
    A2—A1=政策效果
    
    投射一实施后
    
    时 间
    
    图二 “投射一实施后”对比分析
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    (3)“有—无政策”对比分析。这种分析方法是在刑事政策执行前和刑事政策执行后这两个时间点上,分别有政策和无政策两种情形进行前后对比,然后再比较两次对比结果,以确定刑事政策的效果。如图三所示,A1、B1分别代表刑事政策执行前有无政策的两种情形,A2、B2分别代表刑事政策执行后有政策和无政策的两种情形,(A2—A1)为有政策条件下的变化结果,(B2—B1)为无政策条件下的变化结果,[(A2—A1)—(B2—B1)]便是政策的实际结果。这种方法进一步排除了非政策因素的作用,能够比较有效地将被评估政策的“纯结果”从政策执行后产生的总结果中分离出来,因而被认为是测量政策“纯结果”和“净影响”的主要方法。[18](见图三)
    
    
    
    政策执行前
    
    政策执行后
    
    A2
    
    B2
    
    A1
    
    B1
    
    A为有政策
    
    B为无政策
    
    (A2-A1)-(B2-B1)=政策效果
    
    时 间
    
    
    
    图三 “有一无政策”对比分析
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    (4)“控制对象—实验对象”对比分析。这种分析方法是社会实验法在刑事政策评估中的具体应用。它要求评估者将刑事政策执行前同一评估对象分为两组,一组为实验组,即对其施加政策影响的组,另一组为控制组,即不对其施加政策影响的组,如图四所示,A1、B1为实验前实验对象和控制对象的状态(二者同一),A2为实验后的实验对象状态,B2为实验后的控制对象状态,政策效果则为A2—B2。
    
    政策执行前
    
    政策执行后
    
    A2
    
    A1和B1为执行前是同一的
    
    A2为实验对象的情况
    
    B2为控制对象的情况
    
    A2—B2=政策效果
    
    时 间
    
    图四 “控制对象——实验对象”对比分析
    
    A1
    
    B1
    
    B2
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    以上四种不同模式的对比分析法,究竟能在多大程度上被刑事政策评估工作所实际应用,还需要评估者视具体情况而定。但如论如何,现代政策科学的研究成果可以而且应当被应用到刑事政策评估中,这一思路应当坚持。
    
    2、成本效益分析法
    
    成本效益分析法是刑事政策评估的又一种重要方法,它是对刑事政策成本与刑事政策效益加以对比的分析方法。这一方法遵循以下两条评估原则:
    
    (1)当两种政策方案的效益相等时,政策成本越小的政策方案越优;反之,当两种政策方案的成本相等时,政策效益越大的政策方案越优;(见图五)
    
    
    如上图所示,当甲乙两种方案的效益均为E1时,由于甲方案的成本小于乙方案,因此甲方案优于乙方案;反之,当甲乙两种方案的成本均为C4时,由于乙方案的效益大于甲方案,因此乙方案优于甲方案。
    
    (2)政策效益与政策成本的比率越大越好。如图六所示,X轴表示方案选择,Y轴表示政策成本与政策效益之比,R表示政策成本曲线,K表示政策效益曲线。两条成本与效益曲线相交于P、Q两点。在点P之下,政策效益太低;在点Q之上,政策成本太高。可选择的在点P、Q之间,而选择X1处最佳,因为此时效益与成本差距最大。
    
    在运用成本效益分析法时,一项重要的内容涉及到如何准确界定成本和效益。对此,有的刑事政策学者做了有益的探索,认为刑事政策成本既包括直接成本,又包括间接成本;既包括基本成本,又包括辅助成本;既包括短期成本,又包括长期成本。刑事政策效益既包括可计量效益,又包括不可计量效益;既包括基本效益,又包括派生效益;既包括短期效益,又包括长期效益。刑事政策评估既要重视直接成本、基本成本、短期成本与可计量效益、基本效益和短期效益,又要重视间接成本、辅助成本、长期成本与不可计量效益、派生效益和长期效益。[19]对这些不同形态的成本和效益,可分别用不同的方法去衡量,有的可以直接量化,有的则要在定性研究基础上通过加权才能量化。[20]
    
    
    
    
     三、影响刑事政策评估的主要因素
    
    
    
    刑事政策评估质量的高低,不仅决定着评估环节在政策过程中的地位,而且也对新一轮政策运行起着重要的影响作用。因此,深入剖析制约、影响和妨碍刑事政策评估的因素,对于提高刑事政策质量具有重要意义。笔者认为,影响刑事政策评估的主要因素有以下几方面:
    
    
    
    (一)刑事政策评估体制
    
     一个良好的刑事政策评估体制对于提高刑事政策的评估质量有着决定性的意义。相反,如果刑事政策评估体制不健全,或者不科学,那就会使刑事政策的评估质量大打折扣。
    
    有政策科学工作者认为,一个科学的政策评估体制应当包括以下内容:1、形成对决策工作既相对独立又相互耦合的运行机制;2、建立适合政策评估工作需要的信息网络;3、官方政策评估机构、企业政策评估机构和民间政策评估机构相互配合。[21]
    
    另有的刑事政策学者对“局内人”评估和“局外人”评估两种不同评估体制的优劣进行了对比,认为“局外人”评估具有下列特点:1、能够以客观、公正的态度进行评估,其评估不会受先入为主的偏见、切身利益或其他利害关系的约束;2、对刑事政策的意图的理解不一定十分准确,对刑事政策执行效果的信息等资源的占有不一定充分。而“局内人” 评估则具有下列特点:1、对刑事政策制定的意图的理解很准确,对刑事政策执行效果的信息等资源的占有可以十分充分;2、评估活动易受先入为主的偏见、切身利益或其他利害关系的约束,难以用客观、公正的态度来进行评估。
    
    应当承认,由于我国的刑事政策评估作为一项真正规范化的工作来开展还处于起步阶段,因而在刑事政策评估体制方面还存在一系列有待完善的地方,例如:在刑事政策评估中,准确的信息资源是高质量评估工作的前提和基础,但目前我国在信息公开方面还存在制度上和观念上的障碍,以致于许多信息无从获悉,这无疑给刑事政策评估带来极大的困难。以死刑政策为例,在西方,保留死刑的国家公开死刑的数字被视为公众知情权的应有含义,这也就使得他们对死刑政策的评估可以建立在实证研究的基础上,因而得出的结论也就比较有说服力。但在我国,“司法机关判处和执行死刑的数字,一直被视为国家的绝密材料,从未向世人公布。于是,死刑被蒙上一层神秘的色彩,使人们欲知不能,竞相猜测。”[22]很显然,这种状况不利于对死刑效果的评估,使死刑对犯罪的威慑力永远建立在假设之上。
    
    
    
    (二)刑事政策评估主体
    
    
    
    刑事政策评估主体是指进行刑事政策评估的人员或机构。有学者对我国刑事政策评估的主体做了列举,认为主要有以下几种:1、政府决策部门。2、政府研究机构。3、临时任命的小组。4、社会科学院等公共研究机构和大学的研究机构。5、其他私营研究机构和个人,等等。[23]当然,上述每一种主体内部又可做进一步的区分,如评估机构或评估项目的领导人员,评估方案的设计人员,评估活动的实施人员(包括调查统计人员和综合分析人员),评估结论的得出人员等。
    
    不论哪一种评估主体,他们的价值取向、态度立场和个人背景都会对刑事政策评估的结果产生相当程度的影响。首先,价值取向是刑事政策评估的出发点。不同的价值取向会导致其采用不同的评估标准,自然也就会得出不同的评估结论。一场农民运动,在封建土豪劣绅和国民党右派看来,实在是“糟得很”,而在毛泽东等革命派看来,却是“好得很”,“觉到一种从来未有的痛快”。[24]其原因在于二者的价值观完全不一样。在刑事政策领域也是如此,例如,是以社会保护为本位还是以人权保障为本位,将直接影响评估者对类推等刑事立法政策的看法,前者往往会对类推持肯定态度,后者则往往会对类推持否定态度。其次,评估者的态度立场也很重要。“从某种意义上说,政策评估也就是政策批评。”[25]因此,评估者应当具备独立的品性和批判性的思维,敢于和善于排除外界的影响和干预,秉着坚持真理的精神,实事求是地评估一项政策的得失,对政策失误和政策成绩既不隐瞒,也不夸大。如果评估者不能奉行此一准则,而是有意向领导溜须拍马、歌功颂德,或者患得患失、前怕狼后怕虎,就不可能站在客观公正的立场上来评估刑事政策。[26]另一方面,评估者能否以扎实认真的态度去从事评估工作,也会对评估结论有影响。刑事政策的评估是由一系列环节组成的,其中既包括调查统计等定量工作,也包括分析评估等定性工作,哪一个环节都来不得半点马虎,如果偷工减料,或者流于形式,那么评估的质量就会受影响。再次,评估者的个人背景也会给刑事政策的评估打上烙印。这里所说的“个人背景”,包括评估者的学习经历、知识结构和生活阅历等多方面。例如,一个在西方接受过系统教育的人和一个在中国国内接受系统教育的人,由于其耳濡目染的文化不同,可能在某些问题上的看法也就会不同;一个学者和一个司法实务人员,由于其所关注的角度不太一样(一般而言,学者更关注犯罪嫌疑人和被告人的人权保障,而司法实务工作人员更关注对犯罪的打击和控制),可能在对同一项政策的认同上会有差距;一个自己或其家属、亲人被犯罪分子侵害过的和一个自己的家属或亲人曾经因犯罪被打击处理过的,由于其各自的切身体会不一样,其感受也会在对一项刑事政策的评估中有意无意地表露出来。注意到这一点,就可以在组织刑事政策评估小组时充分考虑到不同人员的组合,或者针对不同人员的意见作出理性的分析。
    
    
    
    (三)刑事政策评估方法
    
    
    
    科学的评估方法是提高刑事政策评估质量的重要保证。如前所述,政策评估方法可以从不同角度进行多种划分:既有定量方法,又有定性方法;既有自我评估法,又有专家评估法;既有事实评估法,又有价值评估法,等等。这还是就总体论,具体到评估的每一阶段,又可以分为不同的方法。[27]例如,在社会调查阶段,就可以分为普查、典型调查和抽样调查等方法,而抽样调查又可分为简单随机抽样、等距抽样、分层抽样、整群抽样和分段抽样等方法。[28]评估者应当针对不同的刑事政策选择适当的评估模式,并综合运用统计分析、系统分析等手段,遵循评估的逻辑程序,从而使刑事政策评估能获得理想的结果。
    
    应当指出的是,在设计和运用某些评估方法进行评估时,由于这些方法要求较高的自然科学或工程技术含量,而刑事政策评估人员往往缺乏独立完成此种任务的能力,此时可以委托或求助于相关的专业机构和人员来完成该环节的任务,并按照有关规定付给对方必要的酬劳。事实上,有的评估工作也确实是这样做的,如1995年中国社会科学院法学研究所一课题组在对死刑问题所做的一项民意调查中,就借助于国家统计局的力量,从而使调查获得了较好的结果。[29]
    
    
    
    
    
    (四)刑事政策评估环境
    
    
    
    刑事政策评估环境对刑事政策评估的影响主要体现在以下两方面:一是因果关系的复杂性;二是刑事政策制定者和执行者对评估所采取的态度。
    
    因果关系是公共政策过程中的一种基本的关系形态,亦是政策评估需要确定的基本的关系形态。在社会科学研究中,由于其因果关系具有开放性,因而确定起来远没有在自然科学中来得容易,这是因为“人们的行为模式受如此众多外部的社会、经济和政治因素的影响......即便所有的外部经济环境都可控制,也不可能重复任何实验和示范计划的社会环境和政治环境。”[30]刑事政策领域也是如此,一项刑事政策实施后,在为数众多的影响中,到底哪些影响是其直接作用的结果,哪些是其间接作用的结果,哪些影响与其无关,以及政策运行中的行为交叉和资源混合,使得因果关系难以测定。而且,不同的刑事政策在其影响范围和受其他政策行为的干扰程度上又有不同,因而其评估难度也有差别。
    
    刑事政策制定者和执行者对评估能否采取合作和配合的态度也是事关刑事政策评估成败的重要因素。根据有的学者的研究,政策制定者和执行者由于其利害关系,总是会千方百计地对批判性的政策评估进行干扰和抵制,这种干扰和抵制的能量有时非常之大,甚至可以成为政策评估失败的决定性因素。如决策者对于决策失误往往会制造以下理由来把评估引向歧途:1、政策影响是个长期过程,不能在目前就下定论;2、政策的影响在本质上是广泛而普遍的,任何单一的标准都不足以断定政策效果是否真正实现;3、政策的影响是精细的,用粗略的量化表或统计资料无法认定其结果;4、政策效果不理想,是因为投入的资源不够,无法保证政策的彻底执行;5、政策效果的正效应不大,不是政策本身的问题,而是评价的偏误所致。同样,政策执行者与政策评估者之间的冲突也是很大的,因为评估者强调科学的方法和客观性,会使执行者感到威胁和愤怒;评估者会花费执行者的一些时间,他们往往以干扰其日常活动、打乱他们的行动计划为由加以推诿和搪塞。[31]因此,如果不对刑事政策制定者和执行者的这种心态加以分析并予以正确引导,使之主动配合评估者的工作,并从制度上确立起有利于评估工作开展的环境,如必要的信息公开等,就会使刑事政策的评估陷于被动或走向误区。
    
    
    
     四、加强和改进中国的刑事政策评估
    
    
    
    (一)现存问题
    
    
    
    刑事政策评估事业的发展与我国整个政策领域评估工作的发达程度是联系在一起的。在我国,政策学者们一致认为:政策评估还是一项相当薄弱的工作,面临着许多问题和困难。这些问题和困难主要有:1、政策信息系统不完备,获取数据困难;2、评估走过场,搞形式主义,仅具有象征性意义而无实质性意义;3、有的甚至将政策评估作为一种沽名钓誉的手段,对政策的负效应避而不估,对政策的正效应夸大其辞;4、政策评估的人才、经费缺乏,等等。[32]
    
     上述问题在刑事政策评估领域同样存在。不仅如此,由于刑事政策较之一般公共政策还具有其他一些特殊性,因此问题更多。这里,只着重谈三点:
    
     1、对刑事政策评估工作的重要性缺乏足够认识,还没有将刑事政策评估作为一项经常性、制度性的工作来开展。如前所述,刑事政策评估是刑事政策过程的一道重要环节,但在我国,“由于以往不重视刑事政策的合理化和科学性问题,不重视刑事政策的效果问题,不重视对涉及犯罪的社会和人力资源的合理配置和使用问题,因此,人们并不重视刑事政策评估。”[33]这种状况广泛存在于从中央到地方、从短期刑事政策到长期刑事政策的各个领域。一项短期刑事政策,如专项“严打”、季度“整治”,实施完毕后,往往以记功授奖等表彰形式来宣告结束,而对政策效果、特别是治本效果,却缺少有效的评估。至于一些长期性的刑事政策,要不要根据新的形势作出重新评估,以确定其调整方向,则更没有引起应有的重视。如“坦白从宽,抗拒从严”一直是我国建国以来一项重要的刑事政策,但现在我国政府已经签署了《公民政治权利国际公约》,该公约明确赋予了犯罪嫌疑人的沉默权,那么究竟我国在最后批准这项公约时是对此作出保留呢还是不保留。这就需要对“坦白从宽,抗拒从严”这项刑事政策作出一系列的评估:这项刑事政策到底在帮助公安检察机关破案过程中起到了多大作用,如果赋予犯罪嫌疑人沉默权是否会影响公安检察机关对案件的侦破,在多大程度上影响,可否通过其他途径如提高办案人员的业务水平、强化办案手段的科技含量等来弥补;它对实践中的刑讯逼供现象到底产生了多大影响,确立犯罪嫌疑人的沉默权制度会在多大程度上扭转刑讯逼供现象;帮助破案的“利”与刑讯逼供的“害”相比,到底谁重谁轻,在价值上做何取舍?又如“两个基本”,即“基本事实清楚,基本证据确凿”,到底在实际中产生了哪些效果,它与刑事诉讼法的规定是否相符;再如“改造第一,生产第二”,在市场经济形势下实施效果如何,如实施效果不好,原因何在?等等。总之,我们还没有把对刑事政策的评估工作提到应有的高度,因而也就缺乏一套经常性和制度性的工作思路。
    
     2、在有限的内部刑事政策评估工作中,存在着评估质量不高的现象。这种质量不高起源于下列原因:一是评估主体不合理。有的刑事政策评估由政策制定者或执行者自己来评估,且多带有工作总结的性质,其结果必然是成绩多于问题,成绩是实的,问题是虚的;成绩是主要的,问题是次要的。二是评估过程不规范。有的评估既缺乏必要的方案设计,也缺乏认真的调查研究,更缺乏综合的分析,凭印象,或以偏概全,就简单下结论。三是评估方法不科学。有的评估本该首先使用定量的方法,然后再使用定性的方法,却直接使用定性的方法。有的评估本该沉下去进行调查研究,以获得可靠的第一手资料,却浮在面上,或用第二手资料甚至第三手资料来做评估依据。四是评估标准不恰当。如有的地方或部门将统计报表上的刑事案件发案率的下降视为衡量“严打”效果的唯一标准,却没有考虑到统计不实等影响“发案率”的问题,结果导致了错误的评估结论。实际上,据公安机关的权威人士透露:“从近几年的情况看,在一些地方公安机关(如上海、江苏)统计的刑事案件数字大量增加的同时,当地的公众安全感却随之增强,当地的社会治安状况也明显好转。这从另一方面说明公安机关等执法部门依法办理的案件越多,社会治安状况就会越好。”[34]五是有的评估主体不负责任,官僚主义、形式主义严重。六是评估环境不理想。如实践中存在的“官出数字、数字出官”等不正之风,使得统计数字犹如雾里看花,难辨真伪;各种达标要求又使得各地互相攀比,无法将真实的情况和意见表达出来。这些都给高质量的评估工作带来巨大的难度。
    
     3、信息、资料不公开,使得外部评估寸步难行。在国外,司法神秘主义早已成为历史,信息公开制度已经普遍建立,每年的犯罪统计包括各类不同的犯罪统计,[35]每年的判刑人数包括在那些还保留有死刑的国家被判处死刑的人数,以及每年的监狱关押人数等都要向国民公开,这已被视为纳税人的知情权之一。此种环境自然大大有利于各种外部评估机构和人员对刑事政策的评估。事实上,在国外,一些研究机构在刑事政策评估中扮演着重要角色,有时,刑事政策决策部门直接委托这类研究机构进行有关刑事政策的评估。[36]但在我国,这方面的情况还很不理想。不要说纯民间机构和普通研究人员,就连社会科学院这种半官方的机构,也难以得到一些必要的信息和资料。在这种情形下进行刑事政策评估,无异于沙滩之上建大厦,难以得出有说服力的结论。正因如此,我国的犯罪学者和刑事政策学者远不象国外学者那样对实证研究抱有热心,而是更衷情于“理性主义”,致使对许多刑事政策的认识停留在假设和既定思维之中,究竟其效果如何,无从验证。前面提及的死刑威慑力问题是一个例子,其他还有很多例子,如短期自由刑对犯罪分子到底有无改造效果,现今的禁毒扫黄政策是否成功,等等。
    
    
    
    (二)改进建言
    
    
    
    针对我国刑事政策评估工作的上述缺陷和问题,特提出以下改进意见:
    
    1、提高对刑事政策评估工作及其意义的认识,高度重视对刑事政策的评估。刑事政策评估对于整个刑事政策过程而言,决不是可有可无的环节,而是必不可少的一环,它不仅有助于相关的政策部门正确认识刑事政策的特点、优劣和成效,以进一步补充、修正和完善刑事政策,而且还有助于科学地开发和合理地配置刑事政策资源,增强刑事政策效益。应当看到,同所有人类认识一样,刑事政策也总是无法完美无缺的,它也必须经过从简单到复杂、从低级到高级、从不成熟到成熟这样一个逐步深化的过程。同时,刑事政策自身也不是静止不动的,它必须随着社会的运动而运动,在运动中不断完善、丰富其内容。刑事政策评估正是深化认识、提高政策水平的重要措施。通过评估,不仅总结经验、肯定成绩,而且发现问题、寻找差距、探寻原因、吸取教训、提出建议,发挥批判性和建设性的功能。
    
    2、建立健全多层次、多方位的刑事政策评估机制,使刑事政策评估工作规范化、制度化。要在纵向确立起从中央到地方、在横向确立起从官方到社会的多种主体互相配合、互相促进的刑事政策评估机制。首先,中央政法委、中央社会治安综合治理委员会、全国人大常委会内务司法委员会等具有高度权威又超脱部门利益的官方机构,应当组织对那些事关全局、影响重大而又跨部门的刑事政策的评估。当然,这些部门自身可能并不一定有足够的评估人手,因而需要组织相关的业务部门和研究机构共同组成评估小组。另外,这种评估由于评估者自己并不熟悉刑事政策执行的实际情况,因而需要依赖有关执行者的汇报材料或总结材料,这里面就存在一个如何去伪存真的问题。其次,最高人民法院、最高人民检察院、公安部、司法部等最高司法机关和行政机关应当有效组织对本系统内的刑事政策的评估。对于那些涉及两家或多家的刑事政策,应当由这些部门联合组成评估小组,如对减刑效果的评估,就要涉及法院和劳改等部门,一家不可能独立完成。第三,各级地方的相关部门也应当在自己的职权范围内,一方面配合中央有关部门的评估工作,另一方面积极主动地做好本地区、本部门的评估工作,如少数民族地区在贯彻执行党的“两少、从宽”政策(即对少数民族犯罪分子要少捕、少杀,在处理上一般要从宽)时,究竟效果如何,是否在法律的框架内执行该政策,等等。第四,要以课题等形式将某些需要从理论或实践上予以攻关的刑事政策交给社会科学院等国家研究机构,充分发挥其智囊团的作用。第五,要鼓励非政府组织在刑事政策评估中发挥积极的作用,逐步使包括刑事政策评估在内的政策评估产业化、市场化。最后,还要使新闻媒体在刑事政策评估中发挥其应有的作用。要使社会公众对各项刑事政策的态度和反映,以及不同评估主体的评估报告或观点及时地在新闻媒体中得到报道。总之,要通过不同主体、不同层次的评估互动,形成一个互为补充、互相促进的良性刑事政策评估机制。
    
    3、优化刑事政策评估环境,加强刑事政策评估的软硬件建设。首先,要加快有利于刑事政策评估的信息公开化制度建设。近年来,我国在政府信息公开化方面迈出了很大的步伐,公安、司法、狱政(包括劳教)等方面也随之取得了一些进步,如警务公开、检务公开、审判公开,就连一直被视为禁区的监狱,司法部也在2001年第一次明确提出了“狱政公开”的政策,[37]但这些大多还停留在“宏大的价值之上”,至于具体怎么个公开法,在许多环节上还缺少一系列的制度和程序做保障,以致于往往流于“口惠而实不至”的境地。[38]例如,我们提出“警务公开”的口号已经好几年了,学者们也曾据此建议借鉴国外的做法,每年发布一本《犯罪白皮书》,公布各类犯罪的发案数、破案数,判处死刑和其他各类刑罚的人数以及被害人被害的原因等,以便有利于社会各界对刑事政策的评估和公众的自我保护,[39]但至今难以落实。其次,要创造一个有利于讲真话、道实情的环境。为了最大限度地得到真实材料,一定要消除有关刑事政策主体的顾虑。如目前我国实行的“社会治安一票否决制”等制度,虽然出发点是为了强化各地方、各部门的社会治安责任心,但实际效果却成了掩盖犯罪实际数字的“自欺欺人”。[40]第三,要加强刑事政策评估的人员培训,加大对刑事政策评估的经费投入。
    
    4、拓展刑事政策评估成果的吸收途径,使之真正服务于刑事政策实践。刑事政策评估不是为评估而评估,而是要服务于实践的,因此,除了要加强刑事政策评估的自身工作外,还要同时建立对刑事政策评估成果加以利用和吸收的机制。比如利用内参、简报等形式将刑事政策评估成果报送有关决策部门、领导同志和相关的政策部门,供其参考和研究;在学术刊物或其他媒体上公开发表评估报告;利用新闻发布会、学术研讨会等形式扩大评估影响。当然,在吸收有关评估成果时,也要采取慎重的态度,特别是当不同主体的评估结论不一样时,更不应简单地决定取舍,此时最好能组织一些专家对这些评估进行再评估,或者将这些不同的评估主体召集到一起,互相交换意见,必要时甚至还要重新组织评估。
    
    
    
    
    
    
    
    
    
    
    --------------------------------------------------------------------------------
    
    
    
    #本文系作者“刑事政策过程研究”系列成果之一,该研究旨在将政策科学的研究成果引入刑事政策的研究。有兴趣的读者还可参看作者发表在《金陵法律评论》2001年秋季号上的《论刑事政策的制定》和《刑事法评论》第10卷上的《论刑事政策的执行》等文。
    
    [1]张国庆:《现代公共政策导论》,北京大学出版社2000年8月版,第186页。
    
    [2] 参见曾纪茂、周晶主编:《公共政策导论》,四川人民出版社2001年4月版,第165页;宁骚主编:《公共政策》,高等教育出版社2000年12月版,第318-319页。
    
    [3] 当然,鉴于有的刑事政策是一种周期较长的刑事政策,因此需要阶段性的评估,但即使这种阶段性的评估,也是一种在政策执行告一段落之后的回头考察,而不是一种“现在进行时”。
    
    [4] 例如,20世纪80年代初出台的收容审查措施,其政策目标是为了打击流动人员犯罪,不能说这一目标没有达到,但由于它在实践中造成了严重的超范围关押、超期关押,对人权保障产生了严重的副作用,因而在1996年修改刑事诉讼法时,经过多方衡量,最后废止了这一制度。
    
    [5] 参见曾纪茂、周晶主编:《公共政策导论》,四川人民出版社2001年4月版,第166页。
    
    [6] (美)迈克尔.罗斯金等著,林震等译:《政治科学》,华夏出版社2001年版,第371页。
    
    [7] 曾纪茂、周晶主编:《公共政策导论》,四川人民出版社2001年4月版,第167页。
    
    [8] 转引自大阪弁护士会编:《开かれた政府を求めて》,第2章“FOIA诞生の历史”,第18页,1995年12月版。FOIA,即Freedom of Information Act(信息公开法)。
    
    [9] 参见何秉松主编:《刑事政策学》,群众出版社2002年4月版,第293页。
    
    [10] 参见周勇编译:《犯罪耗费及其研究价值》,载《国外犯罪与监狱信息》1999年第2期。
    
    [11]E. R. House, Evaluating with Validity(Beverly Hills:Sage,1980),p.121.
    
    [12]关于刑法解释(包括立法解释和司法解释)的时间效力问题之思考,有兴趣的读者可参看作者发表在《检察日报》2002年4月23日理论版上的文章《论刑法解释的时间效力》。
    
    [13] 参见陈振明主编:《政策科学》,中国人民大学出版社1999年8月版,第356页以下。
    
    [14] 参见胡宁生:《现代公共政策研究》,中国社会科学出版社2000年9月版,第237页以下。
    
    [15] 参见周树志:《公共政策学》,西北大学出版社2000年7月版,第335页以下。
    
    [16] 参见何秉松主编:《刑事政策学》,群众出版社2002年4月版,第329页以下。
    
    [17] 参见吴宗宪:《西方犯罪学史》,警官教育出版社1997年版,第656页。.
    
    [18] 参见宁骚主编:〈〈公共政策〉〉,高等教育出版社2000年12月版,第343页。
    
    [19] 参见何秉松主编:《刑事政策学》,群众出版社2002年4月版,第338页以下。
    
    [20] 所谓加权,就是对有关内容因子的权重加以打分量化。关于此种方法的具体操作,可参见周树志:《公共政策学》,西北大学出版社2000年7月版,第335—336页。
    
    [21] 参见刘斌、王春福等著:《政策科学研究》(第一卷),人民出版社2000年2月版,第321-323页。
    
    [22] 鲍遂献:《对中国死刑问题的深层思考》,载杨敦先、曹子丹主编:《改革开放与刑法发展》,中国检察出版社1993年8月版。
    
    [23] 参见何秉松主编:《刑事政策学》,群众出版社2002年4月版,第299—301页。
    
    [24] 参见毛泽东:《湖南农民运动考察报告》,载《毛泽东选集》(第一卷),人民出版社1991年6月版。
    
    [25] 刘斌、王春福等著:《政策科学研究》(第一卷),人民出版社2000年2月版,第277-278页。
    
    [26] 当然,我们在分析这一因素时同样不能离开制度建设的思路,这一思路可以朝以下两个方向发展:一是从制度上保证评估机构和人员的独立,二是从制度上确立起评估工作的民主决策机制,使评估结果来自于“群众”而不好归罪于某一个领导。
    
    [27] 一般认为,政策评估的程序可由四个环节组成,它们是:1、设计评估方案,包括明确政策目标,选择评估标准等;2、获取资料,包括建立统计指标体系和进行社会调查;3、综合分析,包括分析政策效果、政策效益等;4、作出结论,包括规范分析和价值分析。参见刘斌、王春福等著:《政策科学研究》(第一卷),人民出版社2000年2月版,第287页以下。
    
    [28] 参见刘斌、王春福等著:《政策科学研究》(第一卷),人民出版社2000年2月版,第295页以下。
    
    
    
    [29] 参见胡云腾:《存与废—死刑基本理论研究》,中国检察出版社2000年4月版,第342页。
    
    [30] (美)J.E.安德森:《公共政策》,华夏出版社1990年版,第194页。
    
    [31] 转引自郑传坤主编:《公共政策学》,法律出版社2001年5月版,第211页。
    
    [32] 参见陈振明主编:《政策科学》,中国人民大学出版社1999年8月版,第361—364页。
    
    [33] 参见何秉松主编:《刑事政策学》,群众出版社2002年4月版,第292页。
    
    [34] 唐军祺、刘仁文:《1998—1999年:中国社会治安形势分析与预测》,载汝信、陆学艺等主编:《1999年:中国社会形势分析与预测》,社会科学文献出版社1999年1月版。
    
    [35] 西方犯罪学界认为,由于受多种原因的影响,象卖淫、毒品等类犯罪难以统计到精确数字,而象杀人、爆炸等类犯罪却不容易存在黑数,因而分类统计对于准确把握犯罪动态具有积极意义。
    
    [36] 参见何秉松主编:《刑事政策学》,群众出版社2002年4月版,第300页。
    
    [37] 参见《南方周末》2001年8月30日文章:《狱政公开:监狱里的阳光》。
    
    [38] 参见贺卫方:《具体法治》,法律出版社2002年1月版,自序第2页。
    
    [39] 参见刘仁文、樊在勤:《跨世纪的社会治安》,载汝信、陆学艺等主编:《2001年:中国社会形势分析与预测》,社会科学文献出版社2001年1月版。
    
    [40] 参见李玫瑾:《犯罪预防的新思路与实践》,《公安大学学报》2001年第4期。
    

RELATED ARTICLES

相关文章