论文摘要
对于商业银行来说,银行的利润就是经营风险的收益。而如何打破银行间的界限,跳出银行产品的“窠臼”,使客户的信用风险信息共享,最终以完整的视图看待一名客户的风险,是商业银行急需解决的一个问题。而随着Internet/Web技术的快速普及和迅猛发展,各种海量的客户基本数据信息可以在网络上获得。如何合理的利用这些客户信息,是一个值得大家探讨和研究的课题。本文讨论和研究了基于XML的Web信息抽取在商业银行实际系统的具体应用,对Web上客户信息的有效采集和搜索做了进一步研究。主要研究了和Web数据抽取相关的XML技术、Web数据挖掘理论,以及Web信息采集技术、网页信息抽取技术、Web信息搜索技术等,在此基础上结合商业银行自身的特点和要求,根据XML技术的特点和要求,采集抽取已知Web系统的客户详细信息,完成Web页面解析,Web数据采集,Web数据清理,Web数据服务等功能,实现客户的“一站式”查询和检索,使得商业银行的风险监控由事后反应转变为事前预测,实现经营风险的自动预警,全面提升商业银行分析、使用信息和管理风险的能力。商业银行客户信息风险监控系统合理的对外部Web系统上各种海量的客户基本数据信息进行数据采集、挖掘、清理、分析,使之成为商业银行自己可以充分利用的数据。系统打破了银行间的界限,跳出银行产品的“窠臼”,使客户的信用风险信息共享,最后以完整的视图看待一名客户的风险。因此,Web数据抽取在商业银行中的应用将变得非常具有现实意义。从技术成熟度和业务需求的迫切性来讲,Web数据抽取研究具有一定的可行性和必要性。课题将结合实际,将理论与现实需求相结合,提炼出Web数据抽取在商业银行客户风险监控中的实际意义和影响。同时也可以提供同行业借鉴和参考。