基于数据挖掘的失业人员再就业预测模型研究

基于数据挖掘的失业人员再就业预测模型研究

论文摘要

实现充分就业是近年来我国的一个工作重点,虽然各级政府和社会各界对就业工作十分重视,并探索出许多有益的经验,但随着城镇化、工业化、经济成分多元化和就业形式多样化,劳动关系将更趋复杂,就业形势将更为严峻。充分就业是现代国家宏观经济的重要目标之一。本文为2007年度浙江省科技厅支撑和引导计划面上项目——《基于网格的分布式劳动力市场决策支持系统》的核心研究内容,主要研究面向劳动力市场决策支持的功能层,即建立符合国内实际情况的劳动力需求、供给等模型库和方法库。失业人员并不是完全被动的承受者,有必要从微观层面出发,对个体的选择行为进行剖析。因此,本文从研究国内外失业理论和发展、我国就业和失业特征、现状、存在问题和解决办法等入手,通过总结和分析,对我国失业再就业突出问题:劳动力供需、失业率、再就业困难程度进行了深入探索。应用数据挖掘等技术和方法构建了基于趋势模式的劳动力供需时间序列预测模型、基于竞争神经网络的失业预警模型和基于聚类的失业人员再就业困难程度评分评级模型。基于趋势模式的劳动力供需时间序列预测模型利用基于趋势模式的时间序列挖掘算法TTSDM将时间序列转换成时间子序列数据集以提取序列模式,进行基于置信度的时序趋势模式预测。基于竞争神经网络的失业预警模型利用基于LVQ的层次化组合算法SOM-LVQ使分类边界得以收缩而更加准确;而由SOM作为启发式过程初始化LVQ的权值,提升了LVQ算法整体性能。基于聚类的失业人员再就业困难程度评分评级模型利用K-Means聚类算法对评分结果自动聚类,得到再就业困难程度分级,有效的解决了传统评级方法均方差,分界值确定难的问题。为了提高聚类性能,解决局部极小解,确定K-Means聚类算法初值的选取问题,提出一种新的基于距离的初始化方法,它不需要设定门限,不受数据集的顺序影响,而且对孤立点和噪声有较强的抑制能力。本文以杭州市劳动和社会保障局人力资源系统数据和杭州市2006统计年鉴数据为样本输入和局部利用开源数据挖掘软件Weka进行模型实证分析。这些预测预警模型,为帮助失业人员再就业,提高社会就业率提供了定量分析工具和决策支持服务。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 1 引言
  • 1.1 研究背景与研究意义
  • 1.2 研究现状
  • 1.2.1 就业和失业问题
  • 1.2.2 我国失业人员再就业扶持办法与存在问题
  • 1.3 研究内容与创新点
  • 1.3.1 研究内容
  • 1.3.2 创新点
  • 1.4 论文的内容安排
  • 2 数据挖掘的基本理论
  • 2.1 数据挖掘概述
  • 2.1.1 数据挖掘概念
  • 2.1.2 数据挖掘常用技术
  • 2.2 数据挖掘基本方法论
  • 2.2.1 数据挖掘过程
  • 2.2.2 数据挖掘常用算法
  • 3 基于趋势模式的劳动力供需时间序列预测模型
  • 3.1 劳动力供需时间序列
  • 3.1.1 劳动力供需相关研究概述
  • 3.1.2 时间序列数据挖掘
  • 3.2 基于趋势模式的时序数据挖掘TTSDM
  • 3.2.1 TTSDM基本思想
  • 3.2.2 TTSDM算法
  • 3.3 TTSDM实证分析
  • 3.3.1 数据准备
  • 3.3.2 实证分析
  • 4 基于竞争神经网络的失业预警模型
  • 4.1 失业预警的理论与方法
  • 4.1.1 经济预警与失业预警
  • 4.1.2 经济预警方法体系
  • 4.1.3 基于竞争神经网络的失业预警方法
  • 4.2 自组织映射
  • 4.2.1 自组织映射神经网络概述
  • 4.2.2 自组织映射神经网络原理
  • 4.2.3 自组织映射学习算法
  • 4.3 学习矢量量化
  • 4.3.1 学习矢量量化神经网络概述
  • 4.3.2 学习矢量量化神经网络原理
  • 4.3.3 学习矢量量化学习算法
  • 4.4 基于LVQ的层次化组合算法SOM-LVQ
  • 4.4.1 SOM-LVQ基本思想
  • 4.4.2 SOM-LVQ算法
  • 4.4.3 SOM-LVQ实现
  • 4.5 SOM-LVQ实证分析
  • 4.5.1 明确警源
  • 4.5.2 划分警度
  • 4.5.3 分析警情
  • 5 基于聚类的再就业困难程度评分评级模型
  • 5.1 就业困难概述
  • 5.1.1 就业困难的概念
  • 5.1.2 就业困难的界定及存在问题
  • 5.2 就业困难程度评分评级指标体系
  • 5.2.1 指标体系
  • 5.2.2 指标含义
  • 5.3 基于层次分析法的评分模型
  • 5.3.1 层次分析法的原理
  • 5.3.2 基于层次分析法确定指标权重
  • 5.3.3 评分模型
  • 5.4 基于聚类的评级方法CBRM
  • 5.4.1 传统评级方法
  • 5.4.2 聚类评级
  • 5.4.3 基于距离的聚类初始化方法
  • 5.5 CBRM实证分析
  • 5.5.1 聚类结果
  • 5.5.2 聚类结果比较
  • 6 结论与展望
  • 6.1 论文总结
  • 6.2 进一步的研究方向
  • 7 参考文献
  • 附录1 攻读硕士期间发表的论文
  • 附录2 攻读硕士期间参加的课题和项目
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    基于数据挖掘的失业人员再就业预测模型研究
    下载Doc文档

    猜你喜欢