文本数据挖掘在工程图文档中的应用

文本数据挖掘在工程图文档中的应用

论文摘要

文本数据挖掘技术是自然语言处理研究的重点问题之一,而工程图文档是工业技术中的重要数据媒体之一。在信息时代,同其他多媒体数据一样,工程图文档作为一种在网上共享传输的数据媒体,有着信息保护和信息检索的需求。传统的信息保护和信息检索技术均基于文本,而工程图文档中存在的大量文本信息,于是我们将文本数据挖掘技术引入工程图文档中。本文对文本数据挖掘在工程中的应用进行了研究,内容文本信息抽取、文本分类、信息隐藏、信息检索等等。本文主要研究了如下两个问题:一、到目前为止,尚没有大型搜索网站将工程图纳入自己的搜索数据类型。本文将文本数据挖掘的方法,引入到工程图文档的信息检索技术中。研究了工程图文档的信息检索方法,比较了工程图文档检索和一般文本检索的区别,提出了工程图信息检索中的几种新方法,详述了一个构建工程图信息检索系统的实验步骤。二、工程图的信息隐藏在CAD领域中具有重大的意义。为了技术保密,工程图在发布时往往需要将其中的关键信息(如尺寸和材料)隐藏起来,其中大部分需要隐藏的信息是以文本方式存在的。传统的信息隐藏是通过人工的方式进行关键文本抽取并加以隐藏而实现的。本文提出了用线性分类的方法,来实现工程图关键文本的自动抽取,从而达到工程图文档信息隐藏的目的。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 文本数据挖掘简介
  • 1.1 文本数据挖掘的概念
  • 1.2 文本数据挖掘基本技术
  • 1.2.1 文本信息抽取
  • 1.2.2 文本分类
  • 1.2.3 文本聚类
  • 1.2.4 文本数据压缩
  • 1.2.5 文本数据处理
  • 第二章 工程图与文本数据的关系
  • 2.1 工程图中的文本数据
  • 2.2 文本数据挖掘在工程图中的主要应用
  • 2.2.1 工程图文档的信息检索
  • 2.2.2 工程图文档的信息隐藏
  • 2.3 本文主要研究内容
  • 第三章 文本数据挖掘在工程图文档检索中的应用
  • 3.1 信息检索的基本理论
  • 3.2 文本搜索的相关技术
  • 3.2.1 离线索引法
  • 3.2.2 统计语言模型
  • 3.2.3 词性标注
  • 3.2.4 中文分词技术
  • 3.3 常用的文本检索技术
  • 3.3.1 位置检索
  • 3.3.2 字段限定检索
  • 3.4 工程图文档检索与文本文档检索的关系
  • 3.5 创建工程图文档检索系统的步骤
  • 3.5.1 工程图文档的文本抽取
  • 3.5.2 建立工程图文档词典
  • 3.5.3 建立文档集的词索引表
  • 3.5.4 目标文档的排序
  • 3.6 小结
  • 第四章 文本分类在工程图文档中的信息隐藏应用
  • 4.1 目标和动机
  • 4.2 算法概述
  • 4.2.1 标注文本,构建训练集
  • 4.2.2 指定和训练关键词与干扰词
  • 4.2.3 选取文本特征,构建向量空间
  • 4.2.4 训练权值
  • 4.3 实验结果
  • 4.3.1 训练集的测试
  • 4.3.2 文本分类的测试
  • 4.3.3 工程图的文本隐藏结果
  • 4.4 小结
  • 第五章 具有信息隐藏功能的工程图检索系统设计
  • 5.1 系统运行流程
  • 5.2 系统架构
  • 5.2.1 实体层
  • 5.2.2 数据库访问层
  • 5.2.3 文件访问层
  • 5.2.4 逻辑层
  • 5.2.5 应用层
  • 第六章 总结与展望
  • 6.1 文本数据挖掘技术展望
  • 6.2 本文工作总结
  • 6.3 今后改进的方向
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于文本数据挖掘的学术期刊选题策划研究[J]. 煤炭高等教育 2016(05)
    • [2].文本数据挖掘技术对速记教学及语料库建设的启示——以松下幸之助演讲数据分析为样例[J]. 韶关学院学报 2015(07)
    • [3].文本数据挖掘在电子商务网站个性化推荐中的应用[J]. 商 2016(34)
    • [4].电力文本数据挖掘现状及挑战[J]. 浙江电力 2019(03)
    • [5].基于文本数据挖掘技术的图书馆地方文献资源开发利用研究[J]. 河南图书馆学刊 2019(10)
    • [6].文本数据挖掘技术在名老中医临床诊疗经验的应用研究[J]. 中国民族民间医药 2017(22)
    • [7].基于专利文本数据挖掘的技术预测方法与实证研究——以纳米技术在能源领域应用为例[J]. 情报理论与实践 2017(04)
    • [8].基于改进Hadoop云平台的海量文本数据挖掘[J]. 湖南师范大学自然科学学报 2016(03)
    • [9].Web文本数据挖掘技术及其在电子商务中的应用[J]. 菏泽学院学报 2011(02)
    • [10].欧盟《数字化单一市场版权指令》文本数据挖掘版权例外制度评析[J]. 法制与社会 2020(12)
    • [11].共现分析技术在生物医学信息文本数据挖掘中的应用[J]. 中华医学图书情报杂志 2009(03)
    • [12].基于文本数据挖掘的复式交分道岔设备故障事件分析[J]. 科技与创新 2020(02)
    • [13].文本数据挖掘技术在Web知识库中的应用研究[J]. 科技通报 2012(12)
    • [14].基于文本数据挖掘的邮轮整船隔离事件的微博情感分析[J]. 中国旅游评论 2020(02)
    • [15].我国劳动生产率相关研究综述[J]. 价格月刊 2009(07)
    • [16].基于XML的Web文本数据挖掘模型构建[J]. 电脑与电信 2008(09)
    • [17].文本数据挖掘在数字图书馆中的应用研究[J]. 硅谷 2009(07)
    • [18].基于双聚类方法的生物医学信息学文本数据挖掘研究[J]. 图书情报工作 2012(18)
    • [19].文本数据挖掘在数字图书馆中的应用研究[J]. 兰台世界 2009(24)
    • [20].1979—2008年我国劳动生产率相关研究文献分析——基于数据挖掘的研究综述[J]. 天水行政学院学报 2009(03)
    • [21].高校智能快递服务满意度研究——以“近邻宝”智能快递为例[J]. 统计与管理 2018(08)
    • [22].基于数据挖掘技术肺癌中医药治疗用药特点和规律研究[J]. 世界科学技术(中医药现代化) 2012(05)
    • [23].“中非论坛”在法媒中的报道状况[J]. 新闻传播 2019(17)
    • [24].大数据与档案行业发展的技术应用[J]. 黑龙江档案 2015(04)
    • [25].一种基于混合概率模型的文本分类方法[J]. 微电子学与计算机 2011(11)
    • [26].基于文本数据挖掘技术的95598业务工单主题分析应用[J]. 电力需求侧管理 2016(S1)
    • [27].Swanson关联研究中分析方法研究的进展[J]. 医学信息学杂志 2009(02)
    • [28].基于古代文献论“燥”与痉病的相关性[J]. 中医学报 2016(04)
    • [29].一种文本数据挖掘与可视化的新方法[J]. 北京生物医学工程 2008(02)
    • [30].基于文本数据挖掘的轨道电路故障智能分类[J]. 测控技术 2020(10)

    标签:;  ;  ;  ;  ;  

    文本数据挖掘在工程图文档中的应用
    下载Doc文档

    猜你喜欢