在刑事辩护案件中,律师经常会面对当事人家属提出的一个问题:“我们家的,会判几年?”围绕这个问题,还会延伸出诸多疑问,如:“我们想向被害人赔钱,全赔完的话可以减轻多少?”“现在我们都认罪了,能不能判缓刑呢?人在里面几年出不来可废了呀。”
面对这些问题时,笔者通常会拿出上海市高级人民法院《关于常见犯罪的量刑指导意见》实施细则(分为(一)、(二)两份法规):“来,我们这个XX案件属于数额巨大,即三年以下十年以上的档次。量刑起点为3-4年,在50000元基础上每增加5500元的涉案金额,相应增加一个月的刑期。本案中我们还有坦白情节,如果再全额退赔并获得谅解的话,估计也就4-5年的样子。”可是大多数情况下,这样的回答并不能满足家属。有时因为家属在判例网站、法治新闻中寻找到了情节类似的案件,与预测的刑期差别较大(家属往往会对量刑较轻的案件印象深刻),有时则是因为涉案罪名并不在《量刑指导意见》的调整范围(交通肇事罪、故意伤害罪、强奸罪等23项罪名)之内。此时律师一般只能依靠阅读大量判例,花费较长的时间才能做到心里有数。
某日,笔者的同事谈起他正接洽的一起酒吧闹事案件,嫌疑人酒后将酒吧的桌椅、洋酒砸坏,因涉嫌寻衅滋事而被刑事拘留。面对家属的量刑提问,笔者想是否能利用Python,寻求出一套相对快速又科学的统计方法,来解答“情节-量刑”问题。
第一步:使用裁判文书数据库下载对应罪名的裁判文书
中国裁判文书网、无讼案例、Alpha法律智能操作系统,威科先行法律信息库等都是获取官方裁判文书的可行渠道。这些案例检索平台可以根据案由、地域、法院、裁判年份、文书性质和自定义关键词对裁判文书进行初步筛选。本次需要调研的为上海地区的损毁财物型(非随意殴打他人、强拿硬要财物型)寻衅滋事案件,笔者根据以下检索条件,获得裁判文书556份。(《量刑指导意见》自2014年7月1日起实施,故仅采用2015年以后的裁判文书)
第二步:确定总样本中各个量刑情节发生的频数,剔除样本过少的量刑情节,确定统计基准
《刑法》总则中规定了防卫过当、避险过当、犯罪既遂(仅指以犯罪未遂部分确定基准刑的情形)、犯罪预备、犯罪未遂、犯罪中止、从犯、胁从犯、教唆犯、未成年人犯罪、老年人犯罪、限制行为能力的精神病人犯罪、又聋又哑的人或者盲人犯罪、立功和重大立功等量刑情节,但是某些情节实际出现的情况极少。这里使用os、docx、re模块遍历并搜索样本裁判文书的正文内容(搜索时排除附后法律条文段落,否则干扰文本过多)。
得出以上量刑情节发生的频数如下:
由于该些量刑情节的频数均在2%以下,故予以剔除。根据以上筛选方式,得到裁判文书546份为最终样本。
最终样本符合以下情况:被告人非老年犯+正常刑事责任能力+非聋哑盲+无紧急避险/正当防卫+既遂犯+主犯+无立功情节。现在就可以研究该些被告人(即绝大多数被告人)的认罪态度(自首/坦白/当庭自愿认罪),损毁财物具体金额(千元),退赔谅解情况,前科/累犯情况对于裁判刑期的影响。
第三步:设定刑期为应变量,设置金额/认罪态度/赔偿谅解/前科累犯情况等自变量的值,绘制图表
应变量Y-刑期为连续定量变量,取其实际值(月)。自变量X1-损毁金额也是连续定量变量,取其实际值(千元)。分组自变量X2-认罪态度、X3-赔偿谅解,X4-前科累犯的取值如下(根据《量刑指导意见》确定的各情节增加/减少基准刑的幅度,设置具体值):
虽然上述提到的案例检索平台开发程度不断提升,产品功能也愈发丰富,但目前为止尚未实现对每份刑事判决书的涉案金额(具体数字)、量刑情节、刑期等进行提取并批量导出的功能。笔者只能通过正则匹配方式获取文本,并以一定的方式转化为数据,最后使用pandas模块将所有数据整合起来。幸运的是,刑事判决书的书写较为格式化,如涉案金额总是出现在“检察院指控——以上事实/上述事实”或“经审理查明——本院认为”的段落中,并以“人民币XXX元”体现。认罪态度、赔偿谅解、前科累犯等总会出现在“本院认为——判决如下”段落中。而刑期总是以汉字和年月日书写的。笔者经大量实验,认为通过正则匹配获取的数据与实际情况的符合率可以达到90%-95%左右。
此处假设法官按照《量刑指导意见》的逻辑,首先通过损毁金额确定基准刑,然后根据被告人的量刑情节,作百分比调整。
使用matplotlib.pyplot模块画出(X-损毁金额,Y-刑期)散点图如下:
在未被认罪态度、退赔谅解情况、前科累犯情况调节的情况下,损毁财物金额与被告人的刑期并未呈现出线性关系。
做到此步时,笔者发现了一个问题,即寻衅滋事罪属于刑期较轻的罪名,大多数实际刑罚在一年以内。因此在量刑时就要考虑到被告人实际羁押的时间(即刑罚不能调整到低于实际羁押的时间以下)。笔者继续批量读取裁判文书,仅保留刑罚月数大于羁押时间的样本,共389份。
使用statsmodels下OLS模块进行简单最小二乘法多元线性回归,得出以下统计结论:
根据多元线性回归的结果,损毁财物型寻衅滋事罪被告人刑期预测方程为:刑期(月)=0.11*损毁金额(千元)+7.93*认罪态度+2.9*赔偿谅解情况+16.57*前科累犯情况-19.15。
表中的R-squared(R方)是回归平方和与总离差平方和的比值,表示总离差平方和中可以由回归平方和解释的比例。R方介于0~1之间,越接近1,表示模型越精确,回归效果越显著。并且由于自变量X2、X3之间存在一定相关性(未认罪的被告人不存在赔偿谅解的可能),会导致模型估计的偏差。
结合散点图以及R方的值,可以看出在损害财物类寻衅滋事案件中,对刑期(月数)做预测可能与最终的实际情况有一定偏离。可能因为司法实践中对于被告人的量刑还有更多其他因素需要考虑,并不是单纯、冷冰冰的机器运算。当然,这并不是说上文的探索是没有意义的。比如在个案中发现量刑建议明显偏离大多数案件的情况,可以向检察官、法官等提出,避免量刑畸高。也有可能在其他罪名的案件中,拟合的情况会好一些。
2021年7月,最高法、检更新了《关于常见犯罪的量刑指导意见》,意图进一步推进量刑规范化工作,或许再经过几年,对于“情节-量刑”问题的探索会有更多进展,更好地帮助到法律工作者们。
文:邵洋
本文为星瀚原创,如需转载请先联系。









