(原标题:数据标签实现同案类推 人工智能如何辅助办案?)
人工智能技术与司法制度的深度结合可能会深度凸显在两个方面:其一是AI速裁,以智能机器人和法官相结合所完成的简易案件速裁。其二是案件预测全覆盖,辅助当事人参与诉讼,或者帮助诉讼参与人作出理性的预判。
高某某驾驶一辆白色越野车在某市街头发生交通事故,导致4车相撞3人受伤,高某某等在原处被抓获后,经检测每百毫升血液酒精含量243毫克。
高某某将面临何种处罚?
当高某某的案件来到法院后,一套智能办案辅助系统会自动告诉法官,自家法院已经判决了多少起类似案件,平均量刑为多长时间,这些判决书中的判决依据是什么。
同样的技术服务也已面向普通公众,市面上多款法律AI产品都已具备这种类案推送功能,有的产品甚至还能够支持当事人的语音查询识别。
“甚至系统可以告诉你某个法官处理这类案件中上诉率、二审发回率、他常采信的证据、他的裁判观点、他关注的争议焦点等等。”法律科技公司华宇元典总经理、曾经的检察官邹劭坤在1月5日接受21世纪经济报道记者采访时表示。
这种智能辅助办案技术正在越来越多的法院中应用,建立在海量司法大数据、语义识别,以及初步的机器学习技术之上。尽管受访的司法和技术人士均表示,这还只是“极低水平的智能化”,但已经开始为司法领域描绘一幅人工智能前景。
人工智能提上政策议程
“智能辅助办案系统出现的背景,是近年来司法机关‘案多人少’的矛盾日渐突出,司法效率亟待提升,同时大数据、人工智能技术取得了很大突破,最高检、最高法先后提出了智慧检务和智慧法院建设。”北京大学法律人工智能实验室副主任江溯说。
从政策脉络中,最高司法机关从最初的“信息化”到“商业智能”,最终大胆提出了“人工智能”的应用目标。
《人民法院信息化五年发展规划(2016-2020)》提出建设基于大数据智能服务的审判支持系统,并提出利用商业智能、大数据分析和可视化手段,对司法审判信息资源库中的数据进行挖掘、分析和展现。
在2016年11月17日的第三届世界互联网大会智慧法院暨网络法治论坛上,最高人民法院院长周强正式提出积极推动人工智能在司法领域的应用,“现在同案类推都是为人工智能的发展奠定了基础”。
国务院2017年7月印发的《新一代人工智能发展规划》也纳入了“智慧法庭”,提出促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用。
“目前法律人工智能领域涌现了多种市场主体,比如人民法院出版社旗下的法信平台,与上海市高级人民法院合作开发‘206工程’的科大讯飞,属于国 家队;还有更多的创业公司在进入,比如电子政务领域的上市公司华宇软件成立了华宇元典,天同律师事务所孵化的无讼,金杜律师事务所孵化的理脉等。”江溯告诉21世纪经济报道记者。
“BAT也有布局,他们因为具有强大的云计算实力而更占优势,但相对低调,他们更愿意用已有技术为司法提供公众服务,而不是切入人工智能领域。”一名互联网企业从事法律服务工作的人士告诉记者。
据报道,腾讯与深圳、广州、北京等地法院合作了小程序诉讼服务,提供在线立案、送达、开庭等服务。21世纪经济报道获悉,腾讯近日将上线智慧法院开放平台,此前腾讯已推出了智慧城市等开放合作平台。
“在中国,有许多像华宇元典这样的法律科技公司在竞逐,他们用自己的方法在探索,试图改变当前的法律服务市场。”邹劭坤告诉21世纪经济报道记者,华宇元典与母公司华宇软件合作,已推出了面向法院的智慧裁判解决方案和面向检察院的智慧公诉辅助系统。
辅助系统如何运作?
智能辅助办案系统中,上海的“206工程”是一项标杆,它的全称是上海刑事案件智能辅助办案系统。
这项工程由中央政法委交办,因交办日期为2月6日而得名,科大讯飞为“206工程”配备了215名技术人员,其中,在上海高院现场办公79人。
最高法院司改办规划处处长何帆曾公开介绍,法官决定判决某个罪名的案件时,写好判决书放入系统里,系统会自动提示跟本院以及上级法院有将近85%的类似情况下的判决是不一样的,问法官是否坚持这样做,若坚持该判决,那么系统将自动把判决推送给庭长以供讨论。
这可以被理解为一个具有法律机器人雏形的智能辅助办案系统是如何运作的。广州市中院向记者提供的材料显示,广州两级法院平均每天产生2500件新收、结案案件信息,历史案件数字化信息超过300万件。基于海量案件信息,广州法院以案由为分类,建立了庞大的案件特征要素库(案件词库),并辅助办案。
第一步是智能提取案件要素。一件案件的案件材料涉及当事人提供的纸质材料、从立案到结案审判辅助人员录入的各类信息、庭审中诉讼参加人的实时语音数据、审判人员撰写的各类法律文书。
这些材料形成后,系统按照“从图片、语音到文字,从文本到结构化数据”的思路,利用OCR(光学字符识别)技术、语音识别技术、文本分析技术,将每件案件关键信息提取出来,录入案件要素特征库。
案件要素特征库中的海量数据由系统自动采集,数据质量相对较差,无法直接运用于辅助办案工作。
广州市中院提供的材料显示,大数据中心数据质量模块通过人工调整和自动调整两种手段对海量数据进行处理,补充不完整数据,修正错误数据,去除冗余数据。
“比如在纸质案卷扫描成电子文档,以及庭审录音转化成文字后,法院工作人员对生成的文字进行校对纠错,在纠错过程中,系统进行一定的自动学习,逐渐提高转化的准确率,这是目前比较成熟的智能化应用。”中国社科院国家法治指数研究中心副主任吕艳滨说。
在此基础上,法官办案时,系统通过案件画像技术理解在办案件,根据案件要素特征库中匹配案件特征,推送关联案件信息。
推送的信息主要包括:与在办案件当事人有关的诉讼、信访情况;与在办案件特征类似的生效裁判文书;全市法院对此类案件的裁判趋势;符合在办案件特征的法律法规条文。
“在外行人的潜意识里,可能认为法律是一个封闭的规则体系,按照三段论,系统中具有法律规定的大前提,输入发生的案件事实,就会得出相应的裁判结果。但实际上存在数不清的争议点和模糊地带。”邹劭坤告诉21世纪经济报道记者。
用机器取代大量重复性工作
2017年初,一则南京市中院将引入智能机器人判案的报道激起了舆论,但南京市中院随即辟谣称,该院并未成立机器人项目组,更没有任命项目负责人,并称“个别企业为了推销产品,无中生有地编造我院引进所谓‘法律机器人’项目”。
事实上,直到现在,智能辅助办案系统也尚未普及。南京市某基层法院法官告诉21世纪经济报道记者,“这种类案推送可以提高简单案件的审理效率,但实际作用不大,因为每个案件事实有差异,不可能都检索到相同案例,还是要依法、独立思考。”
“目前的人工智能辅助司法还处在极低的水平上,比如刑法规定了几百个罪名,可目前能自动推送的只有20几个简单罪名。”江溯说。
“有的法律智能产品能针对输入的案情材料,给出罪名的预测,并分析不同刑期的百分比,这只是一种数据统计技术,属于比较初级的大数据技术,不能算作人工智能。理想中的司法人工智能,应该是系统通过对类案的学习,对法官的裁判进行纠偏。”吕艳滨告诉21世纪经济报道记者。
“目前的法律人工智能仍处于要解决基础性、程序性工作的阶段,集中于搭建好基础设施,让散见于法、检、律之间的数据能够联动、流通,用机器取代大量重复性、低附加值的工作,也即解放整个法律行业的生产力。”华邹劭坤说。
“法律智能研发目前最大的困难和整个计算智能行业是相同的,即如何取得足够专业、大量的行业知识标签数据。突破这个困难需要大量的法律行业专家和计算机算法专家,甚至非常可能是需要培养法律-算法的跨学科专家。”他说。
数据是机器学习的前提。对于市场化的法律人工智能服务来说,其大数据来源是中国裁判文书网上公布的文书。截至1月2日,中国裁判文书网的访问总量近125亿次,累计公开裁判文书超过4131万篇。
“但这些公开的文书只是海量文书的一部分,数据的不完备会影响系统识别、推送的精确度。”江溯说。
相较于市场化公司,智能辅助办案系统可以使用法院内部数据库,但采取“全样本库”仍是一个逐渐的过程。最高法院司改办规划处处长何帆2017年12月曾公开介绍,全国法院司法数据系统还没有完全打通,在数据流通与可获取性上还存在一定问题。
机器学习本身也需完善。2017年12月11日,纽约市议会通过了算法问责法案,以解决算法歧视问题。原因是一些算法,在犯罪预测、量刑辅助等决策活动中的使用存在着严重的歧视问题,尤其是对黑色人种的歧视。
“某种程度上,这也可以看做是数据的质量问题,因为美国历史上的很多判例中包含了种族歧视的因素,而这些判例又作为数据被机器所学习。事实上,世界各国都存在数据污染问题,不是种族歧视也会是其他问题,需要今后给予解决。”江溯说。
“人工智能未来肯定能助力司法审判工作,但我认为它能取代法官则是危言耸听了。审判工作混杂着情理法,涉及到价值、道德等层面,还需要法官作出判断。”吕艳滨说。
《人民法院报》2017年12月14日的一篇文章认为,人工智能技术与司法制度的深度结合可能会深度凸显在两个方面:其一是AI速裁,以智能机器人和法官相结合所完成的简易案件速裁。其二是案件预测全覆盖,辅助当事人参与诉讼,或者帮助诉讼参与人作出理性的预判。
“我认为人工智能在司法领域有非常广阔的前景,成熟的人工智能辅助司法,甚至可能有利于减少诉讼,因为当事人通过人工智能分析案情后,对案件的审判结果会有比较稳定的预期,如果败诉可能性太大,就会转而寻求别的解决方式。”江溯说。
相关新闻: