alpha法律智能操作系统实例(Python X律师工作效率⑤：刑事案件中的量刑)

环球商讯

2022-04-20 08:07:44

在刑事辩护案件中，律师经常会面对当事人家属提出的一个问题：“我们家的，会判几年？”围绕这个问题，还会延伸出诸多疑问，如：“我们想向被害人赔钱，全赔完的话可以减轻多少？”“现在我们都认罪了，能不能判缓刑呢？人在里面几年出不来可废了呀。”

面对这些问题时，笔者通常会拿出上海市高级人民法院《关于常见犯罪的量刑指导意见》实施细则（分为（一）、（二）两份法规）：“来，我们这个XX案件属于数额巨大，即三年以下十年以上的档次。量刑起点为3-4年，在50000元基础上每增加5500元的涉案金额，相应增加一个月的刑期。本案中我们还有坦白情节，如果再全额退赔并获得谅解的话，估计也就4-5年的样子。”可是大多数情况下，这样的回答并不能满足家属。有时因为家属在判例网站、法治新闻中寻找到了情节类似的案件，与预测的刑期差别较大（家属往往会对量刑较轻的案件印象深刻），有时则是因为涉案罪名并不在《量刑指导意见》的调整范围（交通肇事罪、故意伤害罪、强奸罪等23项罪名）之内。此时律师一般只能依靠阅读大量判例，花费较长的时间才能做到心里有数。

某日,笔者的同事谈起他正接洽的一起酒吧闹事案件，嫌疑人酒后将酒吧的桌椅、洋酒砸坏，因涉嫌寻衅滋事而被刑事拘留。面对家属的量刑提问，笔者想是否能利用Python，寻求出一套相对快速又科学的统计方法，来解答“情节-量刑”问题。

第一步：使用裁判文书数据库下载对应罪名的裁判文书

中国裁判文书网、无讼案例、Alpha法律智能操作系统，威科先行法律信息库等都是获取官方裁判文书的可行渠道。这些案例检索平台可以根据案由、地域、法院、裁判年份、文书性质和自定义关键词对裁判文书进行初步筛选。本次需要调研的为上海地区的损毁财物型（非随意殴打他人、强拿硬要财物型）寻衅滋事案件，笔者根据以下检索条件，获得裁判文书556份。（《量刑指导意见》自2014年7月1日起实施，故仅采用2015年以后的裁判文书）

第二步：确定总样本中各个量刑情节发生的频数，剔除样本过少的量刑情节，确定统计基准

《刑法》总则中规定了防卫过当、避险过当、犯罪既遂(仅指以犯罪未遂部分确定基准刑的情形)、犯罪预备、犯罪未遂、犯罪中止、从犯、胁从犯、教唆犯、未成年人犯罪、老年人犯罪、限制行为能力的精神病人犯罪、又聋又哑的人或者盲人犯罪、立功和重大立功等量刑情节，但是某些情节实际出现的情况极少。这里使用os、docx、re模块遍历并搜索样本裁判文书的正文内容（搜索时排除附后法律条文段落，否则干扰文本过多）。

得出以上量刑情节发生的频数如下：

由于该些量刑情节的频数均在2%以下，故予以剔除。根据以上筛选方式，得到裁判文书546份为最终样本。

最终样本符合以下情况：被告人非老年犯+正常刑事责任能力+非聋哑盲+无紧急避险/正当防卫+既遂犯+主犯+无立功情节。现在就可以研究该些被告人（即绝大多数被告人）的认罪态度（自首/坦白/当庭自愿认罪），损毁财物具体金额（千元），退赔谅解情况，前科/累犯情况对于裁判刑期的影响。

第三步：设定刑期为应变量，设置金额/认罪态度/赔偿谅解/前科累犯情况等自变量的值，绘制图表

应变量Y-刑期为连续定量变量，取其实际值（月）。自变量X1-损毁金额也是连续定量变量，取其实际值（千元）。分组自变量X2-认罪态度、X3-赔偿谅解，X4-前科累犯的取值如下（根据《量刑指导意见》确定的各情节增加/减少基准刑的幅度，设置具体值）：

虽然上述提到的案例检索平台开发程度不断提升，产品功能也愈发丰富，但目前为止尚未实现对每份刑事判决书的涉案金额（具体数字）、量刑情节、刑期等进行提取并批量导出的功能。笔者只能通过正则匹配方式获取文本，并以一定的方式转化为数据，最后使用pandas模块将所有数据整合起来。幸运的是，刑事判决书的书写较为格式化，如涉案金额总是出现在“检察院指控——以上事实/上述事实”或“经审理查明——本院认为”的段落中，并以“人民币XXX元”体现。认罪态度、赔偿谅解、前科累犯等总会出现在“本院认为——判决如下”段落中。而刑期总是以汉字和年月日书写的。笔者经大量实验，认为通过正则匹配获取的数据与实际情况的符合率可以达到90%-95%左右。

此处假设法官按照《量刑指导意见》的逻辑，首先通过损毁金额确定基准刑，然后根据被告人的量刑情节，作百分比调整。

使用matplotlib.pyplot模块画出（X-损毁金额，Y-刑期）散点图如下：

在未被认罪态度、退赔谅解情况、前科累犯情况调节的情况下，损毁财物金额与被告人的刑期并未呈现出线性关系。

做到此步时，笔者发现了一个问题，即寻衅滋事罪属于刑期较轻的罪名，大多数实际刑罚在一年以内。因此在量刑时就要考虑到被告人实际羁押的时间（即刑罚不能调整到低于实际羁押的时间以下）。笔者继续批量读取裁判文书，仅保留刑罚月数大于羁押时间的样本，共389份。

使用statsmodels下OLS模块进行简单最小二乘法多元线性回归，得出以下统计结论：

根据多元线性回归的结果，损毁财物型寻衅滋事罪被告人刑期预测方程为：刑期（月）=0.11*损毁金额（千元）+7.93*认罪态度+2.9*赔偿谅解情况+16.57*前科累犯情况-19.15。

表中的R-squared（R方）是回归平方和与总离差平方和的比值，表示总离差平方和中可以由回归平方和解释的比例。R方介于0~1之间，越接近1，表示模型越精确，回归效果越显著。并且由于自变量X2、X3之间存在一定相关性（未认罪的被告人不存在赔偿谅解的可能），会导致模型估计的偏差。

结合散点图以及R方的值，可以看出在损害财物类寻衅滋事案件中，对刑期（月数）做预测可能与最终的实际情况有一定偏离。可能因为司法实践中对于被告人的量刑还有更多其他因素需要考虑，并不是单纯、冷冰冰的机器运算。当然，这并不是说上文的探索是没有意义的。比如在个案中发现量刑建议明显偏离大多数案件的情况，可以向检察官、法官等提出，避免量刑畸高。也有可能在其他罪名的案件中，拟合的情况会好一些。

2021年7月，最高法、检更新了《关于常见犯罪的量刑指导意见》，意图进一步推进量刑规范化工作，或许再经过几年，对于“情节-量刑”问题的探索会有更多进展，更好地帮助到法律工作者们。

文：邵洋

本文为星瀚原创，如需转载请先联系。

alpha法律智能操作系统