基于聚类的用户特征分析

基于聚类的用户特征分析

论文摘要

在信息时代,传统的管理思想已经显得力不从心,企业的宗旨正在经历着由“以产品为中心”向“以客户为中心”的转变。通过用户特征分析,企业可以更好地理解用户,发现用户的行为规律。基于这些理解和规律,市场专家可以制定相应的市场策略,同时还可以针对不同用户组进行交叉分析,帮助企业发现用户群体间的变化规律。用户特征分析背后的思想是找到一组和某一个特定的用户在很多方面都相似的用户群。基于这种思想,可以利用数据挖掘中的聚类分析技术来实现用户特征分析。聚类分析是一种重要的人类行为,已经广泛地应用在许多领域中,包括模式识别、数据分析、图像处理,以及市场研究。另一个方面,随着web2.0的兴起和迅速发展,又出现了大量新兴的网络应用技术,如社会化标签。利用这些新的技术,可以很好地辅助聚类分析技术,从而对网络用户的特征进行挖掘和分析。本文以用户特征分析为目的,以聚类分析技术为手段,以社会化标签为辅助,对基于聚类的用户特征分析展开了研究。本文的具体工作包括以下几个方面:(1)基于状态信息的蚁群聚类算法。根据已有的蚁群聚类算法存在的空间和时间上的一些缺点,提出了一种新的基于状态信息的蚁群聚类算法SI-ACC,通过引入蚂蚁的状态信息,以及蚂蚁的行为模式和感觉阈限等概念,改善了算法的质量和自适应程度。(2)基于蚁群聚类的用户特征分析。利用SI-ACC算法对真实的申请银行信用卡的客户数据进行了聚类分析。算法成功地将客户聚成了不同的几个类,通过进一步的分析得出了每一类客户的特征,为银行发放信用卡和对客户进行价值和风险评估提供了决策支持。(3)基于社会化标签的单个用户的兴趣特征分析。针对web2.0中用户的兴趣属性,提出了一种基于标签组的用户兴趣标签图的建立和更新算法TC-Graph,该算法综合了质朴的方法和共存的方法各自的优点,并在计算图中结点和边的权重方面进行了改进和创新。通过该算法,较好地以兴趣标签图和有序标签组的形式反映了单个用户的兴趣特征。(4)基于社会化标签的群体用户的兴趣特征分析。为了计算用户之间兴趣的相似性,在用户兴趣标签图的基础上,提出了一种基于用户兴趣标签图的距离计算方法TC-G-D。该算法把用户的有序的兴趣标签组作为一种新的混合型数据来考虑,提出了对应距离和交叉距离的概念,并把两者综合起来衡量用户间的兴趣相似度,然后运用已有的基于距离的聚类算法对用户进行聚类分析。

论文目录

  • 中文摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 背景知识
  • 1.1.1 客户关系管理与用户特征分析
  • 1.1.2 数据挖掘与聚类分析
  • 1.1.3 Web2.0 与社会化标签
  • 1.2 研究意义
  • 1.3 论文的主要内容
  • 1.4 论文的组织结构
  • 2 相关知识介绍
  • 2.1 聚类分析
  • 2.1.1 聚类分析概述
  • 2.1.2 蚁群聚类算法
  • 2.1.3 聚类分析的应用领域
  • 2.2 客户关系管理
  • 2.2.1 客户关系管理概述
  • 2.2.2 客户关系管理的特征
  • 2.2.3 客户特征分析
  • 2.3 Web2.0
  • 2.3.1 Web2.0 概述
  • 2.3.2 Web2.0 应用
  • 2.3.3 社会化标签
  • 2.4 本章小结
  • 3 基于蚁群聚类的用户特征分析
  • 3.1 问题描述
  • 3.2 基于状态信息的蚁群聚类算法
  • 3.2.1 算法的主要思想
  • 3.2.2 蚂蚁的行为模式
  • 3.2.3 蚂蚁的状态信息
  • 3.2.4 状态信息对蚂蚁的影响
  • 3.2.5 算法描述
  • 3.2.6 算法的特点
  • 3.3 算法验证
  • 3.3.1 实验结果评价
  • 3.3.2 与其他算法的比较分析
  • 3.4 基于 SI-ACC 算法的客户特征分析
  • 3.4.1 实验数据获取
  • 3.4.2 聚类分析
  • 3.5 本章小结
  • 4 基于社会化标签的用户特征分析
  • 4.1 问题描述
  • 4.2 相关工作
  • 4.3 个体用户的兴趣特征
  • 4.3.1 用户的兴趣标签图
  • 4.3.2 基于标签组的用户特征图——TC-Graph 算法
  • 4.3.3 算法描述
  • 4.4 群体用户的兴趣特征
  • 4.4.1 用户的兴趣特征表示
  • 4.4.2 基于兴趣标签图的用户距离——TC-G-D 算法
  • 4.4.3 算法描述
  • 4.5 实验分析
  • 4.5.1 个体用户的兴趣特征分析
  • 4.5.2 群体用户兴趣特征分析
  • 4.6 本章小结
  • 5 总结和展望
  • 5.1 本文工作总结
  • 5.2 下一步工作展望
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].小学数学优质课堂的特征分析[J]. 数学学习与研究 2016(23)
    • [2].小学数学优质课堂的特征分析[J]. 课程教育研究 2017(25)
    • [3].国外学前教育特征分析与启示[J]. 成才之路 2016(34)
    • [4].重视特征分析[J]. 中学生数学 2017(01)
    • [5].地域文化视角下信天游的形成及特征分析[J]. 城市地理 2017(08)
    • [6].日语年轻人用语特征分析[J]. 长江丛刊 2017(11)
    • [7].北京市春节期间爆竹伤流行病学分析[J]. 伤害医学(电子版) 2013(03)
    • [8].论语义特征分析的作用及其局限[J]. 吉林师范大学学报(人文社会科学版) 2011(S1)
    • [9].巧用特征分析法解元素推断题[J]. 新高考(高三理化生) 2011(04)
    • [10].重庆图书馆藏民国期刊特征分析[J]. 河南图书馆学刊 2015(12)
    • [11].语义特征分析法在现代汉语修辞教学中的价值[J]. 贵州工程应用技术学院学报 2015(06)
    • [12].贫困大学生的弱势特征分析[J]. 高教学刊 2015(11)
    • [13].基于需求与特征分析的“馆校结合”开发策略[J]. 中国科技教育 2018(05)
    • [14].现代汉语中语气副词的语义特征分析[J]. 教育教学论坛 2013(24)
    • [15].近年来成德绵总量经济特征分析[J]. 四川工程职业技术学院学报 2008(01)
    • [16].现代世界优秀篮球运动员应具备的竞技能力特征分析[J]. 辽宁体育科技 2019(04)
    • [17].云负载特征分析综述[J]. 信息技术与标准化 2018(06)
    • [18].“淡马锡”模式的管理特征分析及其启示[J]. 金融经济 2015(16)
    • [19].中印两国贸易摩擦的产业特征分析[J]. 国际商务(对外经济贸易大学学报) 2012(02)
    • [20].我国林业高被引论文特征分析——基于CNKI(2010—2019年)数据[J]. 图书情报导刊 2020(09)
    • [21].403个国家(培育)特色小城镇的特征分析及若干讨论[J]. 小城镇建设 2018(09)
    • [22].赣南特困地区农户旅游创业特征分析[J]. 南方农业 2018(28)
    • [23].下沙空气中可吸入颗粒物污染特征分析[J]. 能源环境保护 2016(04)
    • [24].基于图像特征分析的智能机械手控制系统设计[J]. 河南机电高等专科学校学报 2013(06)
    • [25].会计舞弊特征分析[J]. 现代商业 2011(18)
    • [26].2010~2017年福建省突发公共卫生事件特征分析[J]. 预防医学论坛 2019(12)
    • [27].基于CSSCI的期刊特征分析——以《大学图书馆学报》为例[J]. 河北科技图苑 2012(06)
    • [28].2007年中国汽车市场走势特征分析及2008年预测[J]. 交通世界(运输.车辆) 2008(01)
    • [29].社区居民与家庭医生签约状况及人口特征分析[J]. 中国初级卫生保健 2020(01)
    • [30].我国老年人认知障碍特征分析及政策研究[J]. 人口与健康 2020(05)

    标签:;  ;  ;  

    基于聚类的用户特征分析
    下载Doc文档

    猜你喜欢