论文摘要
法院信息化是以信息资源开发利用为核心,以网络技术、通信技术等高科技技术为依托的一种新技术扩散的过程。进入2007年,北京市各级法院的信息化应用从数据的采集、存储和对审判流程管理,过渡到了对审判数据的综合利用和分析。目前,法院业务数据库里面已经拥有数以百万条案件记录,并且其数量还在迅速膨胀,其内在隐含的规律,已不是传统的统计方式、单一维度的统计数字能够表达的。因此能否从海量的数据中迅速、准确的挖掘出有意义、有价值的信息以利于法院审判、执行等各方面工作是信息化建设达到一定程度必将面临的挑战。本文的主要工作是通过研究BI技术,运用数据仓库知识和数据挖掘的聚类等方法,以法院“执行难”为主题,探索解决存在于法院信息化建设中的数据孤岛和海量数据分析的问题,为构建一个开放式的法院决策支持系统做准备。首先,在对法院信息化有一定了解的基础上,进行决策支持的需求收集、过滤、综合,从法院工作的点线面三个方面,合理处理时间、人、案件三者的关系,同时形成一个以门户为中心的决策支持系统的概念雏形。其次,在数据集中的过程中,数据质量是信息挖掘成败的关键问题,因此本文对法院信息化过程中产生的源数据质量情况从业务角度和数据仓库要求两方面进行分析,提出了审判业务数据质量控制的方法。再次,研究、运用数据仓库知识、数据挖掘技术、BI技术,通过对执行案件隐含的各种因素、执行难的主题分析过程,使用聚类方法完成信息的自动集成与分析,形成执行案龄、执兑情况、中止情况、法院及人员等多方位的数据分析成果。目前通过数据仓库、BI相关技术应用于法院信息化,从历年的数据积累中获取宝贵的统计、分析数据,尚属国内领先的技术实现。这些研究填补了法院信息化建设向数据中心建设的空白,引领法院信息化建设向更智能方向进展。本文的主要成果“关于执行案件、执行难的研究、实现结果”已经在法院用户中引起好评和广泛讨论,开创了法院行业数据分析的新思路。