论文摘要
目前,Internet以惊人的速度向前发展,Web作为信息发布与处理的主要平台,蕴含着大量人们迫切需要的知识。而如何将Web中的海量信息中的知识提取并加以利用,一直是人们努力探索的问题。因此,Web文本挖掘技术应运而生,如何通过Web文本挖掘技术来提高文本情报的利用价值成为本文研究的重点。本文通过分析Web页面结构,设计和实现了解析HTML文档树的方法,从Web页面中抽取出了对企业有价值的文本内容。采用了基于字典的统计分词算法对文本进行分词处理,并在此基础上去除了文本中的无意义词。在分析已有关键词提取方法的基础上,引入了一种基于词的统计和分布的权重计算方式实现了文本关键词的提取。综合考虑关键词、句子在文章中的位置以及特殊标记等因素,采取直接从文中提取句子的方法实现了文摘的自动获取。针对重复的文本情报,在计算文本特征句最长公共子序列的基础上实现了文本去重。本文同时分析了SVM分类器所存在的问题,在SVM分类器两类可分的基础上通过结合二叉决策树实现了多类可分,并且设计了SVM决策树的生成算法,然后在此基础上实现了文本分类。综合本文中研究的知识和技术,设计和实现了面向企业竞争情报的Web文本挖掘模块,并应用于企业竞争情报分析与挖掘服务系统中。
论文目录
相关论文文献
- [1].大数据下企业竞争情报人员胜任力模型研究[J]. 现代情报 2020(05)
- [2].大数据环境下新创企业竞争情报预警研究[J]. 情报科学 2020(06)
- [3].基于网络广告的企业竞争情报策略分析[J]. 甘肃科技 2020(17)
- [4].基于关键词共现和社会网络分析法的我国企业竞争情报热点主题研究[J]. 情报探索 2019(08)
- [5].基于大数据时代下的企业竞争情报创新研究[J]. 中国国际财经(中英文) 2018(01)
- [6].第三只眼看企业竞争情报——知名外企法务侍丹青访谈[J]. 竞争情报 2018(02)
- [7].大数据环境下企业竞争情报发展研究[J]. 才智 2018(15)
- [8].企业竞争情报的需求与服务现状[J]. 中华建设 2017(02)
- [9].企业竞争情报能力要素分析[J]. 现代工业经济和信息化 2017(05)
- [10].大数据背景下企业竞争情报人员激励机制研究[J]. 情报科学 2017(08)
- [11].企业竞争情报应用现状调查与分析[J]. 情报理论与实践 2016(02)
- [12].基于多国政府开展企业竞争情报的启示[J]. 商 2016(06)
- [13].企业竞争情报搜集与分析方法[J]. 商 2016(16)
- [14].企业竞争情报的2015新挑战[J]. 中外管理 2015(02)
- [15].基于大数据的企业竞争情报分析方法研究[J]. 图书馆学刊 2015(02)
- [16].企业竞争情报价值的体现[J]. 竞争情报 2014(03)
- [17].构建企业竞争情报预警机制[J]. 竞争情报 2008(04)
- [18].跨国企业竞争情报战略实施[J]. 竞争情报 2011(01)
- [19].关于企业竞争情报实践的另类思考——企业情报人心旅路程和职业感悟[J]. 竞争情报 2012(04)
- [20].电子商务视角下的企业竞争情报战略行为优化[J]. 武汉商学院学报 2015(01)
- [21].移动电子商务对企业竞争情报的影响[J]. 现代经济信息 2015(13)
- [22].企业竞争情报质量的驱动因素和使能因素分析[J]. 情报科学 2015(09)
- [23].微信平台下企业竞争情报搜集策略研究[J]. 情报杂志 2015(11)
- [24].运用概念格分析企业竞争情报需求[J]. 现代图书情报技术 2013(10)
- [25].企业竞争情报战略研究[J]. 黑龙江科技信息 2013(30)
- [26].企业竞争情报作战室方法在管理学教学中的应用[J]. 时代教育 2013(13)
- [27].企业竞争情报中微博分析技术研究:基于需求驱动视角[J]. 情报理论与实践 2015(02)
- [28].唯有“精准”才能有效——对竞争情报支撑企业决策的再认识[J]. 竞争情报 2014(03)
- [29].中国企业竞争情报实施现状调查研究报告[J]. 竞争情报 2009(02)
- [30].大数据时代企业竞争情报运行保障机制建设研究[J]. 现代情报 2015(07)