基于SOM的文本聚类模型研究

基于SOM的文本聚类模型研究

论文摘要

随着信息科技的日益发展,人们所能得到的信息在飞速增长。为了使各种资源能够及时的被用户发掘,搜索引擎已经成为了人们日常生活中必不可少的工具。虽然目前主流的文字搜索引擎都是基于内容的检索,但在实际实施时,它们往往没有从语义的层面处理文本信息。所以,搜索引擎在针对某个查询返回的结果中往往包含了许多并非用户真正需要的信息。基于这种考虑,对搜索引擎返回的结果进行再次分析,挖掘出返回结果中包含的各种主题信息,将会大大的提升用户体验。自组织映射(Self-Organizing Map,SOM)属于人工神经网络的范畴。它不仅能够准确、高效对文本信息进行聚类,而且可以将高维的文本信息映射到用户可直观理解的低维空间中。通过一定的学习规则,SOM网络能够发掘文本集合中潜在的模式,并将这些模式展现在训练稳定的神经元中。对于原始空间中相似的文本,将被映射到邻近的神经元上。对于相异的文本,则被映射到疏远的神经元上。从而保持了文本集合在原始空间中的拓扑结构。但原有的SOM模型中没有考虑文本集合中语义层面的相似性。因此,在原始的SOM模型中引入狄利克雷分布(Latent DirichletAllocation,LDA)模型。LDA模型是一个典型的三层贝叶斯模型,能够完整的描述文档集合的生成过程。通过LDA模型,能够得到文档在给定数目主题上的分布和主题在文档集合的词汇表上的分布。将LDA模型得到的主题作为输入空间的维度,训练SOM神经元的连接权向量。最后,当网络稳定后,即可得到基于语义层面的文档集合的聚类效果。此时,各个神经元的连接权向量即为在各个主题上的分布。找到权重最大的主题,即可作为该神经元的主题。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题的研究背景
  • 1.2 课题的研究目的与意义
  • 1.3 国内外研究的概况
  • 1.4 论文的主要研究内容
  • 2 相关技术分析
  • 2.1 文本聚类技术
  • 2.2 人工神经网络
  • 2.3 主题模型
  • 2.4 本章小结
  • 3 SOM 神经网络的聚类模型
  • 3.1 SOM 神经网络
  • 3.2 SOM 神经网络的测评
  • 3.3 SOM 神经网络的聚类模型
  • 3.4 本章小结
  • 4 LDA 在 SOM 神经网络的聚类模型
  • 4.1 LDA 模型
  • 4.2 LDA-SOM 聚类模型
  • 4.3 本章小结
  • 5 实验验证
  • 5.1 实验环境及数据
  • 5.2 实验步骤
  • 5.3 实验结果及分析
  • 6 总结与展望
  • 6.1 全文总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].SOM网络在雷达目标识别中的应用[J]. 科技视界 2015(16)
    • [2].基于SOM神经网络的人力资源管理风险预警模型研究[J]. 电子设计工程 2015(18)
    • [3].基于SOM的真空断路器机械故障诊断[J]. 电工技术学报 2017(05)
    • [4].基于SOM网络的依托机构办学行为聚类分析[J]. 陕西广播电视大学学报 2016(01)
    • [5].基于SOM网络的城市分类探讨及实证分析[J]. 中国集体经济 2011(18)
    • [6].基于SOM的商业银行客户细分研究[J]. 现代商业 2010(06)
    • [7].基于SOM聚类法的在线学习分析研究[J]. 中国教育信息化 2020(05)
    • [8].基于小波奇异熵和SOM神经网络的微电网系统故障诊断[J]. 山东大学学报(工学版) 2017(05)
    • [9].基于集抄网络及SOM算法的用电异常预警机制[J]. 电子制作 2017(16)
    • [10].多态SOM网络下的非均匀水合物测井方法[J]. 科技通报 2014(04)
    • [11].基于SOM和人工免疫算法的监测区域低功耗分簇协议设计[J]. 计算机测量与控制 2013(04)
    • [12].一种基于属性约简和SOM的客户细分方法[J]. 工业工程 2011(02)
    • [13].基于SOM的电子商务中交易数据库二次聚类算法[J]. 计算机与现代化 2009(12)
    • [14].在数据挖掘中基于SOM网络的数据分析可视化设计[J]. 科技经济导刊 2019(31)
    • [15].Waterlogging risk assessment based on self-organizing map(SOM) artificial neural networks: a case study of an urban storm in Beijing[J]. Journal of Mountain Science 2017(05)
    • [16].基于SOM网络的机场天气聚类分析[J]. 数学的实践与认识 2016(17)
    • [17].SOM网络在铁路危险货物专用线风险评价中的应用[J]. 大连交通大学学报 2015(03)
    • [18].SOM模式下延迟策略实施对客户价值创造的影响[J]. 企业经济 2013(12)
    • [19].面向SOM的制造业服务创新模式研究——延迟策略实施的视角[J]. 中国科技论坛 2013(02)
    • [20].基于SOM网络的农业产业结构研究[J]. 安徽农业科学 2012(04)
    • [21].基于SOM算法的文本聚类实现[J]. 计算机与现代化 2010(01)
    • [22].基于SOM网络模型的供水管网水质综合评价[J]. 中国给水排水 2010(11)
    • [23].一种基于混合核函数的SOM网络流量分类方法[J]. 计算机工程与科学 2010(10)
    • [24].SOM网络的改进及其在储粮害虫分类中的应用[J]. 计算机仿真 2009(10)
    • [25].基于SOM网络的智能入侵检测系统[J]. 计算机仿真 2008(09)
    • [26].基于SOM网络的奖学金评定方法研究[J]. 信息技术 2013(04)
    • [27].基于因子分析和SOM网络的河南城镇化地区差异分析[J]. 江西农业学报 2009(03)
    • [28].数据挖掘中SOM神经网络的聚类方法研究[J]. 情报科学 2009(06)
    • [29].基于SOM网络的带式输送机齿轮箱混合故障诊断研究[J]. 煤矿机械 2020(05)
    • [30].大学生词汇学认知风格的模式分类——基于SOM神经网络的研究[J]. 南京师大学报(社会科学版) 2016(03)

    标签:;  ;  ;  ;  

    基于SOM的文本聚类模型研究
    下载Doc文档

    猜你喜欢