基于网络的多媒体节目编目信息抽取技术的研究

基于网络的多媒体节目编目信息抽取技术的研究

论文摘要

近年来随着数字多媒体业务的不断扩展,数字多媒体业务的观众对多媒体节目编目信息的要求也随之而来。而目前尚没有此领域的研究来满足观众的这一迫切需求,这也正是本文研究的背景和选题的动力。Internet的飞速发展使WEB数据不断增长,导致了大量半结构(semi-structured)数据的产生,因特网上存在的大量与多媒体相关的描述信息使得我们从中获取多媒体节目编目信息成为可能。为了获取多媒体节目的编目信息,论文着眼于Internet资源,将多媒体节目编目信息的网络自动抽取技术作为研究的目标和任务。论文首先研究了WEB信息抽取技术的一般分类和WEB信息抽取系统的一般实现方法。在此基础上,结合多媒体节目编目信息的特点,提出了一个多媒体节目编目信息网络自动抽取系统NMPIES,该系统设计比较简单,结构清晰,理论上可以完成实现论文所提的目标。WEB预处理和网页自动分类是编目信息抽取的前提,也是论文的研究重点。传统的WEB预处理技术一般只涉及到HTML的噪音过滤、文本抽取等技术,利用这些简单技术很难为多媒体节目编目信息的抽取做好准备。因此,论文在研究了HTML网页的特点后,提出了一套适用于多媒体节目编目信息抽取的WEB预处理技术,其中包括HTML-Tree中心内容确定方法、基于HTML-Tree方法的网页特征提取等关键技术,通过这些关键技术的实现,很好地达到了对WEB信息进行预处理的目的,提高了网页自动分类的查准率和查全率。然后论文研究了多媒体节目编目信息抽取的主要实现技术,使用了基于主题的信息抽取方法,该方法通过多媒体节目编目信息模板的构建、主题相似度的判断和模式匹配最终得到较为完整的多媒体节目编目信息,该方法可以较好地完成预期目标,获取一些简单的常用的编目信息。最后,论文在Java平台上实现了论文所提出的多媒体节目编目信息自动抽取系统NMPIES,并进行了大量的实验,取得了较好的结果。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 选题背景和意义
  • 1.2 WEB 信息提取的研究现状
  • 1.3 论文主要研究工作及创新点
  • 1.4 论文内容安排
  • 第二章 多媒体节目编目信息的表述及抽取系统
  • 2.1 多媒体节目编目信息的应用背景与特点
  • 2.2 多媒体节目编目信息的表述方式
  • 2.3 WEB 信息抽取的介绍
  • 2.3.1 WEB 信息抽取的分类
  • 2.3.2 WEB 信息抽取系统的一般实现
  • 2.3.3 WEB 信息抽取系统的关键技术
  • 2.4 多媒体节目编目信息的WEB 抽取系统NMPIES
  • 2.4.1 NMPIES 系统的提出
  • 2.4.2 NMPIES 系统主要模块的描述
  • 2.5 本章小结
  • 第三章 WEB 预处理及自动分类
  • 3.1 噪音过滤
  • 3.2 HTML-Tree 中心内容确定法
  • 3.2.1 HTML 标记权值处理
  • 3.2.2 带权值HTML-Tree 的生成
  • 3.2.3 中心内容块的确定
  • 3.2.4 实验数据与分析
  • 3.3 基于 HTML-Tree 方法的特征提取
  • 3.3.1 特征评估函数的比较
  • 3.3.2 特征权值的计算
  • 3.3.3 基于HTML-Tree 的特征提取方法
  • 3.4 网页的自动分类
  • 3.5 本章小结
  • 第四章 多媒体节目编目信息的抽取
  • 4.1 基于主题的信息抽取方法
  • 4.1.1 主题页面在WEB 上的分布特征
  • 4.1.2 主题网页的选取
  • 4.1.3 多媒体节目编目信息的抽取
  • 4.1.4 实例分析
  • 4.2 本章小结
  • 第五章 NMPIES 系统的编程实现
  • 5.1 NMPIES 系统的软件流程
  • 5.2 对 Java htmlparser 源码包的改进
  • 5.3 使用JNI 技术调用C 语言的文本分类DLL 库
  • 5.4 NMPIES 系统的用户界面模块
  • 5.5 本章小结
  • 第六章 结束语
  • 6.1 总结
  • 6.2 下一步工作
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的学术论文目录
  • 相关论文文献

    • [1].媒介融合背景下如何优化视听新媒体节目内容[J]. 传播力研究 2019(34)
    • [2].视听新媒体节目内容优化策略探析[J]. 西部广播电视 2020(08)
    • [3].新媒体节目主持人文化品牌建构的困境与路径[J]. 当代电视 2018(05)
    • [4].新媒体节目主持人文化品牌建构的困境与路径[J]. 中国多媒体与网络教学学报(上旬刊) 2018(11)
    • [5].新媒体节目主持人的话语样式浅析[J]. 戏剧之家 2017(11)
    • [6].当前新媒体节目主持存在的问题与应对策略[J]. 新闻研究导刊 2016(11)
    • [7].中国新媒体节目主持的经验与教训[J]. 西部广播电视 2016(08)
    • [8].新媒体节目主持人的素养刍议[J]. 新闻世界 2016(07)
    • [9].“无所不传”时代,传统媒体节目的新契机——试谈5G传播技术下的美食节目新形态[J]. 记者观察 2020(08)
    • [10].强化媒体节目正能量的传播[J]. 赤子(下旬) 2016(12)
    • [11].互联网+新媒体节目模式探讨[J]. 散文百家(新语文活页) 2017(06)
    • [12].中国大陆新媒体节目主持的经验与教训[J]. 青年文学家 2016(24)
    • [13].网络视频类评测节目的走红及对传统媒体节目的借鉴价值[J]. 视听界 2020(05)
    • [14].浅析新媒体语境下新媒体节目分级的困境与现实需要[J]. 视听 2017(07)
    • [15].当前中国大陆新媒体节目主持的问题与对策[J]. 戏剧之家 2016(09)
    • [16].以《大鹏嘚吧嘚》为例谈网络媒体节目主持人发展历程[J]. 采写编 2016(01)
    • [17].解析中国电视媒体节目的转型与发展[J]. 经贸实践 2016(01)
    • [18].多媒体节目的视频设计思路与方法探析[J]. 北京印刷学院学报 2013(03)
    • [19].全球化影响下国内媒体节目同质化现象研究[J]. 传媒论坛 2020(16)
    • [20].如何建设农村广播电视台新媒体节目综合网络系统[J]. 中国有线电视 2016(12)
    • [21].浅析主持人在全媒体节目中的作用——以东广新闻台《亲历奥运》节目为例[J]. 西部广播电视 2017(10)
    • [22].中国大陆新媒体节目主持的经验与教训[J]. 新闻研究导刊 2016(09)
    • [23].在自媒体节目新秀《罗辑思维》中的主持特色分析[J]. 编辑学刊 2016(02)
    • [24].当前我国新媒体节目主持的问题与对策[J]. 西部广播电视 2016(13)
    • [25].新媒体节目的创意与策划[J]. 中国环境管理干部学院学报 2015(02)
    • [26].创新编辑思维做好新媒体节目[J]. 记者观察 2020(23)
    • [27].新媒体节目的垂直受众分析——以《看理想》为例[J]. 新媒体研究 2018(09)
    • [28].简析自媒体节目《罗辑思维》的商业思维及其盈利模式[J]. 视听 2015(06)
    • [29].电视媒体节目与新兴媒体的矛盾分析[J]. 现代企业教育 2014(12)
    • [30].探索媒体融合新模式 开创婚恋节目新样态——全国首档日播婚恋交友融媒体节目《有缘天空》河北上线[J]. 采写编 2019(06)

    标签:;  ;  ;  ;  

    基于网络的多媒体节目编目信息抽取技术的研究
    下载Doc文档

    猜你喜欢